شنبه، آذر ۲۸، ۱۳۸۳

یک موتور جستجوی مبتنی بر پردازش زبان طبیعی

Ask Jeeves Introduces Desktop Search Application
معروفترین موتور جستجوی اینترنتی مبتنی بر پردازش زبان طبیعی با نام Ask Jeeves برنامه جدید ارائه داده است.
کاربران با این برنامه می توانند علاوه بر اینترنت تمامی محتوای کامپیوتر خودشان را با سوالات معمولی در زبان جستجو کنند.
همانطور که در سایت مربوطه توضیح داده شده است این موتور جستجو بر اساس زبان طبیعی کار میکند. یعنی شما بجای نوشتن کلمات کلید می توانید سوال خودتان را کامل نوشته و جواب آنرا کامل دریافت کنید.
برنامه جدید این موتور جستجو رایگان ارائه شده است که از آدرس زیر قابل دریافت است



شنبه، شهریور ۲۱، ۱۳۸۳

Memory Translation - MT

حافظه ترجمه :
وظیفه یک سیستم حافظه ترجمه این است که متن جدید را بررسی کرده و در صورت وجود ترجمه های قبلی برای یک متن یا بخشی از آن ، کاربر را از ترجمه دوباره آنها بی نیاز کند. با توجه به تکراری بودن ترجمه در خحم بالا و در موارد خاص استفاده از چنین سیستمهائی مدتهاست که روال شده است.
هرچند این روزها سیستمهای حافظه ترجمه مورد توجه مترجمین حرفه ای قرار گرفته اند، اما باید اشاره داشت که ایده این نوع سیستمها زیاد جدید نیست. تعدادی از شرکتهای ترجمه قبل از این بانکهای اطلاعاتی داشتند که برای صرفه جوئی در هزینه و زمان ترجمه از آنها استفاده می کردند. اما معرفی این سیستمها بصورت تجاری و در بازار نرم افزار باعث استفاده گسترده آن در بین شرکتها و افراد مختلف در زمینه ترجمه شده است.

یک سیستم حافظه ترجمه در چه مواردی می تواند به ما کمک کند ؟
هر کار ترجمه ای که سه ویژگی مهم زیر را داشته باشد را می توان با یک سیستم حافظه ترجمه با هزینه کمتر انجام داد.

1- مطالب تکراری : اگر در متن شما دارای متون مشترک و تکرار به مقدار زیاد است بدانید که این سیستمها می تواند بیشترین استفاده را برای کار شما داشته باشند. بعنوان مثال راهنماهای سیستمها می توانند از این نوع متون برای ترجمه با چنین سیستمهائی باشند.
2- استفاده از فایلهای الکترونیکی : در حال حاضر با توجه به الکترونیکی شدن بیشتر مطالب، استفاده از چنین سیستمهائی مقرون بصرفه شده است. در حال حاضر بیشتر راهنمای ابزارهای و وسایل بصورت الکترونیک هم موجود هستند و براحتی با استفاده از یک سیتسم حافظه ترجمه قابلیت ترجمه به بیش از یک زبان را دارا می باشند.
3- حجم قابل توجه متن برای ترجمه : اگر حجم مطالبی که می خواهید ترجمه کنید کمتر از 100 کلمه است، استفاده از چنین سیستمی مقرون بصرفه نیست. متقاضیانی که متونی کمتر از 3-4 صفحه دارند نمی توانند با استفاده از چنین برنامه هائی به ترجمه مناسب و کم هزینه برسند. بهترین کاربرد این سیستمها در مواردی است که حجم ترجمه بالا باشد. احتمال پیدا شدن یک متن تکراری در حجم بالای ترجمه بیشتر است و بنابراین کاربرد بیشتری برای سیستم حافظه ترجمه می توان در این موارد متصور شد.

بیشتر افرادی که شرایط بالا را داشته اند و از چنین سیستمهائی استفاده کرده اند، 25 الی 30 درصد در هزینه های ترجمه صرفه جوئی کرده اند. هرچه حجم بانک اطلاعاتی سیستم افزایش پیدا می کند یا به عبارت دیگر هرچه با این سیستمها ترجمه بیشتری انجام می شود، مقدار صرفه جوئی در هزینه ترجمه افزایش پیدا می کند. یکی از مواردی که می تواند در کاهش بیشتر هزینه ترجمه موثر باشدف کمترین کار مورد نیاز بر روی فایل شما قبل و بعد از ترجمه است. هرچه ابزاری که از آن استفاده می کنید انعطاف بیشتری داشته باشد و مثلا فرمتهای مختلفی را بعنوان ورودی قبول کند و در خروجی هم فرمتهای مختلفی را ارائه کند، صرفه جوئی در هزینه شما می تواند بیشتر باشد.

در مطالب بعدی با سیستمهای حافظه ترجمه و نمونه های عملی آن بیشتر آشنا خواهیم شد.

شنبه، تیر ۲۰، ۱۳۸۳

نتیجه یک تجقیق در زمینه ترجمه ماشینی

Internet Machine Translation Survey

در این تحقیق علاوه بر معرفی محصولات مختلف در زمینه های مختلف ، پروژه های مختلفی هم معرفی شده اند که بعضا هیچ محصولی در بازار ندارند.
جالبترین قسمت این تخقیق بررسی ترجمه یک جمله در زبانهای مختلف و برنامه های مختلف است.
جمله بصورت زیر بوده است :

I can eat glass and it doesn't hurt me.


و ترجمه هائی در زبانهای دیگر انجام شده و در نهایت با همان مترجم به زبان انگلیسی برگردانده شده است. نتایج بصورت زیر می باشد:


French
Original Je peux manger du verre, cela ne me fait pas mal.
SYSTRAN I can eat glass, that does not make me badly.
WorldLingo " "
FreeTranslation I can eat glass, that does not do me poorly.
PROMT I can eat of the glass, it makes for me not bad.
Reverso I can eat of the glass, it makes(does) for me not bad.
Gist-In-Time " "
LogoMedia I can eat the glass, it made not me pain.
linguatec I can eat glass, it makes me quite a lot.

Spanish
Original Puedo comer vidrio, no me hace daño.
SYSTRAN I can eat glass, does not do damage to me.
WorldLingo " "
FreeTranslation It can eat glass, not damage does me.
PROMT I can eat glass, it(he,she) does not damage to me.
Reverso " "
Gist-In-Time " "
LogoMedia I can eat glass, he/she doesn't harm me.
linguatec I can eat glass, he does not do me damage.
Sancho Am able to eat glass, not becomes damage.
Linguaphile can eat glass, not me makes damage.

Portuguese
Original Posso comer vidro, não me faz mal.
SYSTRAN I can eat glass, does not make me badly.
WorldLingo " "
FreeTranslation It can eat bottle, not evil does me.
LogoMedia I can eat glass, he/she doesn't do me badly.
Gist-In-Time " "

Italian
Original Posso mangiare il vetro e non mi fa male.
SYSTRAN I can eat the E glass it does not make me badly.
WorldLingo " "
FreeTranslation I can eat the glass and does not hurt myself.
LogoMedia I can eat the glass and it doesn't hurt me.
linguatec I can eat the glass and he does not do me.
Gist-In-Time " "


German
Original Ich kann Glas essen, ohne mir weh zu tun.
SYSTRAN I can eat glass, without doing to me pain.
WorldLingo " "
FreeTranslation I can eat glass without hurting myself.
PROMT I can eat glass without hurting me.
Reverso " "
Gist-In-Time " "
LogoMedia I can eat glass without doing me sore.
linguatec I can eat glass without being aching.

Polish
Original Mogę jeść szkło i mi nie szkodzi.
Ectaco I can eat glass and it does not harm me.

Russian
Original Я могу есть стекло, это мне не вредит.
SYSTRAN 4 I can eat with glass-, this me does not harm.
WorldLingo I can eat with glass-, this me does not harm.
PROMT I can eat glass, it does not harm to me.
LogoMedia I can exist glass, to this me does not harm.
Ectaco I can there is glass, this I do not harm.
Dictionary.com I can eat glass-, this me it does not harm.

Arabic
Original .أنا قادر على أكل الزجاج و هذا لا يؤلمني
Ajeeb I able on the glass eating and this he does not hurt me




قابل توجه علاقه مندان به ارزیابی سیستمهای ترجمه ماشینی

یکشنبه، خرداد ۱۰، ۱۳۸۳

یک نوشته برای اولین کارگاه پژوهشی زبان فارسی و رایانه

این از اولین سمینار ( کارگاه) هائی بود که برنامه ریزی مناسبی داشت. هرچند بدلیل رعایت نشدن برنامه های زمانی ارائه شده، کل سمینار با تاخیر انجام شد .
در این سمینار از قبل تمام مطالب افراد ارائه دهنده بر روی یک کامپیوتر نوت بوک قرار داده شده بود. بنابراین اتلاف وقت جهت آماده سازی مطالب برای ارائه دهندگان بسیار کم بود.
هرچند تعدادی از ارائه دهندگان بدلیل نا آشنائی با کامپیوتر نتوانستند استفاده مناسبی از امکانات ارائه شده ببرند.
در میان سمینارهای ارائه شده ، به سبب نحوه ارائه ( البته منظور در زمینه ترجمه ماشینی است ) چگونگی ارائه خانم دکتر شمس فرد بسیار مناسب و حرفه ای بود.
هرچند بقیه دوستان هم تلاش کرده بودند اما سلیقه بکار رفته در این ارائه بسیار مناسب و زیبا بود بطوریکه در حین ارائه براحتی میشد مطلب را در پرده نمایش دنبال کرد.

به هر حال به برگزار کنندگان این سمینار برای برگزاری مناسب آن تبریک می گویم و امیدوارم که این کارگاه ادامه داشته باشد.

نکته ای که باید اضافه کنم فعالیت زیاد سازمانهای دولتی و خصوصی و دانشگاهی در زمینه پردازش صوت و تبدیل صوت به متن و متن به صوت بود. در زمینه OCR هم کارهای مناسبی انجام شده بود.

بنظر میرسد رقابت زیادی در این زمینه ها وجود ندارد و تعداد افرادی که در زمینه های پردازش زبان طبیعی ( فارسی) کار می کنند در کشور بسیار کم است و نیاز به سرمایه گذاری و حمایت دولت از این پروژها های پژوهشی دیده می شود.

یکشنبه، اردیبهشت ۲۷، ۱۳۸۳

برنامه سحنرانی های اولین روز کارگاه پژوهشی زبان فارسی و رایانه

در روزهای پنجم و ششم خرداد ماه 1382 اولین کارگاه پژوهشی زبان فارسی و رایانه در تالار فردوسی دانشکده ادبیات و علوم انسانی دانشگاه تهران برگزار خواهد شد.
در این کارگاه در بخش ترجمه ماشینی سحنرانی های زیر ارائه خواهد شد:

نشست دوم - ساعت یازده الی دوازده و نیم
هیئت رئیسه :
احمد عبدالله زاده ، کارین مگردومیان ، حسن ثامتی
برای هر سمینار بیست دقیقه در نظر گرفته شده است

ترجمه ماشینی فارسی - فرج الله خداپرستی
هستی: سیستم یادگیری هستان شناسی - مهرنوش شمس فرد
مترجم پارس : نرم افزار ترجمه متن انگلیسی به جمله های فارسی - علیرضا عبادت
نرم افزار ترجمه متون از انگلیسی به فارسی و از فارسی به انگلیسی ( مترجم پدیده) - کاظم آیت اللهی
ترجمه ماشینی انگلیسی به فارسی بر مبنای نظریه اجتمالات و گرامر لغوی - هشام فیلی

چهارشنبه، اردیبهشت ۲۳، ۱۳۸۳

نمایشگاه کتاب تهران

امسال در نمایشگاه تهران شاهد حضور شرکت مبنا با محصول مترجم پارس هستیم.
این شرکت بسته نرم افزاری جدید خود را در 38 زمینه تخصصی ارائه داده است.
بنا به گفته کارشناسان این شرکت سال آینده برنامه مترجم فارسی به انگلیسی این شرکت برای اولین بار ارائه خواهد شد.
علاوه بر این مترجم سایت هم یکی دیگر از برنامه های این شرکت نرم افزاری است.
برای دیدن محصول جدید مترجم پارس می توانید به سالن میلاد طبقه دوم مراجعه کنید که به ناشرین الکترونیک اختصاص پیدا کرده است.

علاوه بر مترجم پارس تعدادی از شرکتهای ارائه دهنده دیکشنری هم در این سالن حضور دارند. محصولاتی مانند فانوس ، نارسیس، آریانپور و همچنین فرهنگ دهخدا نیز در این نمایشگاه ارائه شده است.

یک مترجم دیگر هم با ظاهری عجیب در این نمایشگاه ارائه شده است که گزارش مربوط به آنرا می توانید در آدرس زیر بخوانید:
مترجم هوشمند E.B.L

شنبه، فروردین ۲۹، ۱۳۸۳

اولین کارگاه پژوهشی زبان فارسی و رایانه

این کارگاه در دانشگاه تهران و با حمایت سازمانهای زیر بگزار می شود :
مرکز صنایع نوین
وزارت فرهنگ و ارشاد اسلامی
فرهنگستان زبان و ادب فارسی
مرکز تحقیقات و مخابرات ایران
مرکز تحقیقات استراتژیک
انجمن زبان شناسی ایران
انجمن کامپیوتر ایران

مکان برگزاری : دانشگاه تهران
زمان برگزاری : پنجم و ششم خرداد ماه 1382


در این کارگاه در زمینه ترجمه ماشینی هم مطالبی ارائه می شود
برای هماهنگی جهت حضور در این کارگاه می توانید با دانشکده ادبیات و علوم انسانی دانشگاه تهران به شماره تلفن 6112574 و 6461390 تماس بگیرید

شنبه، فروردین ۱۵، ۱۳۸۳

انواع سیستمهای ترجمه ماشینی

سیستمهای ترجمه ماشینی را از نظر نقش ماشین و انسان در ترجمه ، می توان بصورت زیر دسته بندی کرد :

Fully Automatic High Quality Translation - FAHQT


Human-Aided Machine Translation - HAMT


Machine Aided Human Translation - MAHT


Traditional Human Translation



پیشرفته ترین ترجمه بوسیله ماشین، ترجمه کامل و با کیفیت بدون نیاز به انسان میباشد که در بالای این لیست قرار دارد.
از بالا به پائین به ترتیب نقش کامپیوتر در ترجمه کم شده و به ترجمه انسانی می رسیم. در حال حاضر بیشتر سیستمهای ترجمه ماشینی، در دو گروه ترجمه ماشینی با کمک انسان و ترجمه انسانی با کمک ماشین قرار می گیرند.
ترجمه ماشینی با کمک انسان (HAMT)
در اینگونه سیستمهای ترجمه ماشینی، یک برنامه عمل ترجمه را انجام می دهد و انسان در دو حالت می تواند به برنامه در ترجمه کمک کند. این کمک می تواند در حین ترجمه انجام شود که به آن روش تعاملی می گویند. در این روش برنامه در حین ترجمه در مواردی که به حالتهای مبهم می رسد، به کاربر این امکان را می دهد که از بین حالتهای ممکن بهترین را انتخاب کند. این ابهام می تواند در معنی یک واژه باشد یا اینکه در شناسائی گرامری کلمات در جمله باشد. اینگونه سیستمها می توانند مورد استفاده افرادی قرار گیرند که با ترجمه آشنائی دارند. سرعت استفاده از اینگونه سیستمها بدلیل نیاز به کمک انسان، بالا نیست.
در روش دیگر کمک انسان، برنامه قبل یا بعد از ترجمه نیاز به این کمک دارد. به این صورت که ابتدا کاربر بایستی بتواند متن داده شده را ساده کند. جملات بسیار طولانی را به جملات کوتاه تر بشکند . در نهایت متن را به برنامه مترجم بدهد و ترجمه انجام شده توسط ماشین در این مرحله بدون نیاز به راهنمائی انسان ، انجام می گیرد. پس از اینکه ترجمه به پایان رسید، متن ترجمه شده بایستی توسط کاربر ویرایش شود.
البته پس ویراستاری و پیش ویراستاری یک متن می تواند به کیفیت ترجمه ماشینی در هر دو روش کمک زیادی بکند. در این زمینه در یک بخش جداگانه توصیه هائی برای بهبود کیفیت ترجمه ماشینی، ارائه خواهد شد.

ترجمه انسانی با کمک ماشین (MAHT)
اینگونه از سیستمها بیشتر مبتنی بر تجربیات انسانی بوده و ماشین در نقش یک دستیار در ترجمه کاربرد دارد. برنامه های ویراستار متن ، واژه نامه ها و در سیستمهای پیچیده تر برنامه های حافظه ترجمه، از این گروه هستند. برنامه های ویراستار متن و واژه نامه ها در جامعه جایگاه خود را یافته و بعنوان ابزار ترجمه مدتهاست که مورد استفاده مترجمین حرفه ای و نوآموز قرار می گیرند. اما برنامه های حافظه ترجمه ، در بازار ایران ناشناخته مانده است ولی در بازار ترجمه در سطح بین المللی کاربرد وسیعی پیدا کرده است. این برنامه ها با توجه به محدودیتهائی که برای سیستمهای ترجمه ماشینی وجود دارد، توانسته اند به مترجمین حرفه ای کمک شایانی بکنند. روش کار این برنامه بر اساس ترجمه های انجام شده می باشد. هر متنی که برای ترجمه به برنامه ها داده می شود، ابتدا به جملات قابل ترجمه شکسته می شود. برنامه سعی می کند که جملاتی را که قبلا ترجمه شده اند را پیدا کرده و در متن ترجمه شده قرار دهد. در این میان جملاتی که برنامه برای اولین بار با آنها برخورد می کند را در بخش دیگری و با روش دیگری پردازش می کند. جملاتی که برای برنامه ناشناخته باشند نیز آنالیز شده و نزدیکترین جملات و ترجمه آنها به مترجم نشان داده می شوند، در اینجا مترجم با استفاده از ترجمه های مشابه ترجمه دقیق جملات جدید را انجام داده و به برنامه یاد می دهد. دفعات بعد که برنامه به این جملات برخورد کند، ترجمه دقیق آنها را ارائه می دهد. اینگونه از برنامه بر اساس یکی از مهمترین ویژگیهای کار ترجمه ، یعنی تکراری بودن ترجمه ، طراحی می شوند.
هرچند برای زبان فارسی بصورت خاص برنامه ای طراحی نشده است، اما برنامه های مشابه برای زبان عربی وجود دارند که تا اندازه ای می توانند به مترجمین برای ترجمه متون به زبان فارسی یاری برسانند.

پنجشنبه، اسفند ۲۱، ۱۳۸۲

گزارش بعد از ساعت 14

همانگونه که انتظار داشتیم، همه افراد علاقه مند به ارائه سمینار ترجمه ماشینی بعد از ظهر این سمینار را ارائه دادند.
البته یک نکته جالب درباه اولین ارائه کننده بود:
ایشان یکی از اعضای هیئت علمی هستند.
اما به نظر می آمد که به جای ارائه سمینار قصد ارائه یک درس را دارند. چرا که به جای 20 دقیقه حدود 35 دقیقه صحبت کردند
البته با التماس و خواهش این فرصت را گرفتن و بیشتر مطالبی را که برای ارائه آماده کرده بودند، را حذف کردند و بیشتر به انتقاد از کار دیگران و تعاریف کلی از تحقیقاتشان در فرانسه پرداختند.
فرصت ندادند که سوال کنم:
در تمام مطالبی که درباره تاریحچه ترجمه ماشینی نوضته شده هیچگاه اهمیت پروژه های فرانسوی به این حد که آقای دکتر می گفتند نبوده.
البته نکته جالب این بود که می گفتند که این تحقیقات هیچگاه بعنوان برنامه ارائه نشده و دلیل آنرا کار علمی انجام شده می دانستند.

سمینار بعدی را مترجم پدیده ارائه داد. ارائه دهنده به معرفی برنامه های ظرکت پرداخت و در نهایت با ارائه انتظارات خود از دستکاه دولتی و اجرای قانون کپی رایت به سمینار پایان دادند.
این سمینار در وقت مناسب به پایان رسید.

نفر بعدی به ارائه یک مترجم پدید پرداخت.
این مترجم با نام دوران در سال آینده ارائه خواهد شد. البته ایده اصلی آن تر دکترای خود آقای فیلی بوده است که روشی ترکیبی را استفاده کرده اند.
در نهایت هم من سمیناری را درباره ترجمه ماشینی و مترجم پارس ارائه دادم که مطالب آنرا قسمت به قسمت در اینجا ارائه خواهم داد.
بعد از قسمت ترجمه ماشینی، مباحث دیگری هم مطرح شدند . بیشتر درباره فونتهای فارسی و فارسی نویسی یود. البتهیک نفر هم درباره اهمیت تعریف کاربرد زبان فارسی در رایانه صحبت کرد.

در انتهای سیمنار هم آقای دکتر حبیبی به جمع بندی این سمینار از صبح تا عصر پرداختند.

این سمینار در کل مناسب و خوب بود. فقط مشکل عدم اطلاع رسانی مناسب و عدم برنامه ریزی در کل سمینار به چشم می خورد. بطوریکه تا زمان ارائه سمینار ، تعدادی از افراد جدید به ارائه دهندگان اضافه شدند و این باعث می شد که فرصت داده شده به بقیه را کم کنند تا افراد بیشتری بتوانند سمینار بدهند. در حالی که این افراد در محل سمینار آمادگی خود را برای ارائه سمینار اعلام کرده بودند.

امیدوارم که در سمینارهای بعدی در این زمینه شاهد برنامه ریزی بهتری باشیم.

چهارشنبه، اسفند ۲۰، ۱۳۸۲

اولین گزارش از سمیناری با عنوان توسعه کاربرد خط و زبان فارسی در دنیای رایانه

این سمینار با یک ساعت تاخیر بدلیل باران در ساعت 9 صبح شروع شد.
ساعت 9:10 دقیقه:
در این ساعت فهمیدم که برنامه ارائه سمینارها عوض شده و بحث ترجمه ماشینی که قرار بود من ارائه کنم از ساعت 8:40 دقیقه به ساعت 15 منتقل شده و بحث ابتدائی در مورد تزاروس است.
جالبه که تمام افرادی که بر روی تزاروس کار می کنند و مثلا می خواهند واژه های فارسی برای واژه های بیگانه پیدا کنند، خودشان از این واژه تزاروس استفاده می کنند.
البته شاید این کلمه ریشه فارسی داشته باشد. اما در کتابهای دبیرستان و دانشگاه یادم نمی آید که چنین چیزی خوانده باشم.

بدلیل تغییر برناهم سیمینار و اینکه من کارهای زیادی داشتم ، مجبور شدم که از سمینار بیرون بیایم و برای ساعت 14 برگردم.


ادامه این گزارش را بعد از ساعت 14 می نویسم.



برنامه جدید سمینار :

نشست اول :
هیئت رئیسه : دکتر حسین غریبی - دکتر حری - دکتر خسروی - مهندس پور ممتاز
رئیس جلسه : دکتر حسین فریبی

8:50 - 9:10
طرح جامع زبان فارسی - مهندس پور ممتاز
9:10 - 9:30
اصطلاحنامه علوم انسانی -دکتر خسروی
9:30 - 9:50
اصطلاحنامه اسلامی- مهنس سمیعی
9:50 - 10
اصطلاحنامه فنی مهندسی - علوم پایه - کشاورزی - خانم بهشتی
10 - 10:20
نرم افزار تولید اصطلاحنامه - آقای نوروزی
10:20 - 10:40
کاربرد اصطلاحنامه و سیستمهای هوشمند در بازیابی اطلاعات - مهندس پارسی


نشست دوم :
هیئت رئیسه : دکتر سپهری راد - دکتر یحیی تابش - مهندس آزادنیا - مهندس امیر حسین سعیدی
رئیس جلسه : دکتر سپهری راد

11-11:30
بازشناسی حروف و علائم فارسی -مهندس صدیق
11:20 - 11:40
فناوری بازشناسی حروف فارسی - شرکت نگاره
11:40 - 12
خطا یاب املائی - شرکت گستره
12:12:20
خطایاب املائی - دکتر خداپرستی

نشست سوم :
14-14:20
مترجم فارسی - دکتر خداپرستی
14:20 - 14:40
مترجم فارسی - مهندس آیت اللهی
14:40 - 15
مترجم فارسی -مهندس هشام فیلی
15-15:20
مترجم فارسی - مبنا رایانه - مهندس علیرضا عبادت
15:20 - 15:40
فرازبان و تجزیه و تحلیل منطقی زبان - آقای یزدی پور

سه‌شنبه، اسفند ۱۹، ۱۳۸۲

سمینار کاربرد خط و زبان فارسی در محیط رایانه

همانطور که قبلا هم اعلام کردم سمیناری با عنوان کاربرد خط و زبان فارسی در محیط رایانه ای روز چهار شنبه 20 اسفند برگزار می شود.
این سمینار از ساعت 8 صبح تا 5/4 عصر برگزار خواهد شد.
مکان برگزاری هم : باشگاه دانشجویان دانشگاه تهران - حیابان 16 آذر - ساختمان معاونت دانشجوئی خواهد بود.
برگزار کنندگان این سمینار هم کمسیون تخصصی تولید محتوی دبیرخانه شورای عالی اطلاع رسانی و وزارت فرهنگ و ارشاد اسلامی و گروه زبان و رایانه فرهنگستان زبان و ادب فارسی هستند.
برای هماهنگی جهت حضور در این سمینار هم می توانید با آقای صالحی در دبیرخانه این سمینار تماس بگیرید.

آدرس دبیرخانه :
حیابان شریعتی - نبش اندیشه یکم - دبیرخانه شورای عالی اطلاع رسانی - طبقه دوم - معاونت فنی
تلفن : 8448036

برنامه زمانی نحستین نشست تخصصی توسعه کاربری خط و زبان فارسی در محیط رایانه ای

نشست اول : یونیکد، تشخیص نوری حروف و علائم
8:00 - 8:20 :
گزارش دبیر نشست
8:20 - 8:40 :
غلط یاب املائی – گستره نگار
8:40 -9:00 :
مترجم فارسی ( مبنا رایانه)
9:00 - 9:20 :
داده ورزان هامون ( فارسی سازی، مترجم فارسی)
9:20 - 9:40 :
ریشه یابی کلمات (یاس ارغوانی)
9:40 - 10:00 :
یونیکد، کد استاندارد ملی ( گام الکترونیک)
10:00 - 10:30 :
پذیرائی
نشست دوم - گنجواژه، اصطلاحنامه و ترجمه ماشینی
10:30 - 11 :00 :
آیت اللهی، بازشناسی حروف و علایم / پایا بازشناسی حروف و علایم (صدیق)
11:00 - 11:30 :
دکتر حسین غریبی ( اصطلاحنامه ها)
11:30 - 12:00 :
خانم ملوک اسادات بهشتی ( اصطلاحنامه ها)
12:00 - 12:30 :
گام الکترونیک – واژه پرداز نگاره – غلط یاب
13:30 - 14:00 :
نماز و نهار
نشست پایانی
14:00 - 14:30 :
پور ممتاز – طرح جامع
14:30 - 15:00 :
فرازبان و تجزیه و تحلیل منطقی زبانهای طبیعی (معصومی همدانی / یزدی پور / غفاری )
15:00 -15:30 :
دکتر حبیبی
15:30 -16:00 :
مهندس جهانگرد

دوشنبه، اسفند ۱۸، ۱۳۸۲

کاربرد ترجمه ماشینی در جنگهای آینده

به نظر می رسد در جنگهای آینده استفاده از نیروهای چند ملیتی بیشتر خواهد بود همچنانکه در جنگی که آمریکا در عراق داشت این اتفاق افتاد.
در این جنگ یک برناه به سربازان داده شده بود که مانند یک مسنجر کار میکرد
با این تفاوت که این برنامه مسنجر به یک برنامه مترجم ماشینی مجهز شده بود. با کمک این برنامه سربازان و فرماندهان مختلف می توانستند از طریق اینترنت و رایانه با هم ارتباط داشته باشند.
البته احتمالا جزئیات بیشتری هم در ارتباط با چکونگی ارتباز بین سربازان و امنیت این اطلاعات وجود داشته است که در گزارشی که من دیدم اسمی از آن برده نشده بود.
http://www.eurekalert.org/pub_releases/2004-03/oonr-ii030504.php

شرکت در سمینارکاربرد خط و زبان فارسی در محیط رایانه ای

سمینار کاربرد خط و زبان فارسی در محیط رایانه ای قرار است روز چهار شنبخ 18 اسفند 1382 برگزار شود.
من بعد از ارائه سمینار درباره آن بیشتر خواهم نوشت.
امروز هم یک نامه داشتم در زمینه سمیناری در مورد ترجمه ماشینی و کاربردهای عملی آن که این سمینار در انگلستان برگزار میشود.
جالب اینکه زمان اجرا اکتبر 2004 است.
میدانید چند ماه به شروع سمینار مانده است؟ بیشتر از هقت ماه
در مرحله اول باید چکیده مقاله خود را برای آنها بفرستیم . برای این مرحله تقریبا سه ماه فرصت داریم.
بعد از تائید چکیده مقاله فرصت داریم که متن اصلی را برای داوران بفرستیم تا برای ارائه آن برنامه ریزی کنند. برای این مرحله هم زمانی در حدود سه ماه فرصت داریم
تا دو هفته قبل از شروع سمینار می توانیم کل مفاله را برای گروه بفرستیم.

برای اطلاع شما هم آدرس سایت این سمینار را در اینجا ذکر می کنم.
http://www.aslib.com/conferences/submission%20guidelines.html

شاید که مسئولین سمینار کاربرد خط و زبان فارسی در محیط رایانه ای این سایت ها را دیده و مانند آنها برنامه ریزی کنند.

من بعنوان ارائه دهنده سمینار پذیرفته شده ام. اما هنوز نمی دانند که چه ابزاری را برای ارائه دارند.
من هم نمی دانم مطالبم را باید بصورت کپی دست شنوندگان بدهم یا مانند تمام سمینارهای رسمی می توان با پاور پوینت و یا ابزارهای رایانه ای سمینار را ارائه داد.

به هر حال من این انتقادها را در زمان سمینار هم بیان خواهم کرد. با انتقاد و ارائه پیشنهاد می توانم انتظار داشته باشم که در سمینارهای بعدی برنامه ریزی بهتری انجام شود.

سه‌شنبه، اسفند ۱۲، ۱۳۸۲

تفاوتهای یک سمینار در ایران و آمریکا

روز گذشته فاکسی بدست من رسید و خبر از برگزاری یک سمینار در زمینه خط و زبان فارسی می داد.
اما چند نکته درباره این سمینار :
اول اینکه این فاکس در تاریخ 10 اسفند شماره شده بود و تا روز 13 اسفند به شرکتها و افراد مهلت داده بود تا در این زمینه اظهار علاقه کنند . جالب اینکه تاریخ این سمینار روز 20 اسفند اعلام شده است.
این فاکس نیمه شب به 10 اسفند به شرکت ما رسیده یود
روز 11 و 12 اسفند هم تعطیل است.
خوب شما تصور می کنید چطور می توان در دو روز تعطیل این مطالب را برای سمینار ارائه داد؟

بعد از سوال و جواب با دوستان در سازمانهای مختلف فهمیدم که این فاکس برای همه در همین زمان ارسال شده و شرکت ما استثناء نبوده .
اما مگر می شود در عرض یک هفته یک سمینار با ارزش ارائه داد؟ شاید بعضی از دوستان بگویند که خوب افرادی که قبلا در این زمینه کار کرده اند باید برای این سمینارها آمادگی داشته باشند. خوب اینهم حرفی است.
اما دوست دارم توجه شما را به نامه ایمیلی که درباره سمیناری در زمینه ترجمه ماشینی است جلب کنم.
این سمینار در تاریخ 28 دسامبر 2004 در دانشگاه جورج تاون برگزار می شود.
البته متولیان این سمینار هم حتما می توانسته اند که یک هفته قبل از شروع سمینار آنرا به اطلاع علاقه مندان برسانند اما شاید بر اساس تجربه فهمیده اند که آماده شدن برای سمینار حتی برای شرکتهائی که قبلا در این زمینه کار کرده اند بیش از یک هفته طول می کشد.
در این سمینار تازه به هر شرکت یک ماه فرصت داده شده است که چکیده مقاله های خود را برای ارائه به دانشگاه ارسال کنند. خوب هر کسی نمی تواند در یک ماه مقاله را آماده کند مگر اینکه قبلا بر روی آن کار کرده باشد. اما زمان یکماه زمان معقولی است. اما نمی دانم چطور می توان در عرض یک هفته یک مطلب برای سمینار آماده کرد. مگر اینکه کیفیت را فراموش کنیم و فقط یک سمینار ارائه کنیم.

راستی اینرا هم بگویم که این سمینار کار مشترکی است از وزارت فرهنگ و سازما ن مدیریت و فرهنگستان زبان فارسی

به نظر می آید که بودجه اختصاص داده شده به توسعه زبان فارسی برای سال 1382 نتوانسته کامل هزینه شود و طبق معمول در پایان سال تصمیم گرفته اند که این بودجه صرف شود. برای اطلاع از مقدار این بودجه بد نیست نگاهی داشته باشید به صحبتهای آقای جهانگرد درباره بودجه تکفا در سال 82 و 83
http://www.itiran.com/news/show.asp?no=8212092109

مشکل وبلاگ ترجمه ماشینی در پرشین بلاگ

چندی قبل و بدلیل فیلتر شدن سایت پرشین بلاگ از طرف شرکتهای سرویس دهنده اینترنت در ایران مجبور شدم که در وبلاگم که در پرشین بلاگ بود ننویسم. بعد از مدتی این مشکل حل شد و بعضی از شرکتها از برای این مشکل از کاربران خود عذرخواهی کردند.
اما دیدم که مشکل من همچنان وجود دارد و من نمی توانم وبلاگم را ببینم. تا اینکه روزی یک کارت جدید اینترنت بجز پارس آن لاین گرفتم و فهمیدم که مشکل از جای دیگر است.
در این چند وقت صحبتهای زیادی شنیده بودم از اینکه هنوز پارس آن لاین پرشین بلاگ را فیلتر کرده و یا اینکه پرشین بلاگ آی پی های پارس آن لاین را بسته است .
چند روز پیش متنی در اینترنت منتظر شد که همه چیز را مشخص کرد.
مشکل از پارس آن لاین نبوده و این مدیران پرشین بلاگ بوده اند که آی پی های پارس آن باین را بسته اند.
دلیلی آنهم از دلایل جالب می باشد.
به نقل از آقای عطا خالقی ذکر می کنند که دلیل آن مخالفت پارس آن لاین با سرمایه گذاری در پرشین بلاگ بوده و اینکه پرشین بلاگ بدلیل تولید محتوا باید از سود شرکتهای سرویس دهنده اینترنت درآمدی داشته باشد.
راستش این صحبت برای من کمی سنگین بود.
اول از همه اینکه این محتوا تولید شده پرشین بلاگ نیست و توسط نویسندگان مختلف ارائه میشود. بنابراین از این منظر سودی به این شرکت تعلق نمی گیرد. اما حتی اگر فرش را بر این بگذاریم که این شرکت با ارائه این سرویس به این مسئله کمک زیادی کرده ( که به نظر من هم همینطور است) باید بگویم که در دنیای تجارت قهر و آشتی معنی ندارد. آیا بلاگ اسپات که از پرشین بلاگ قدیمی تر و حرفه ای تز است هم به همین روش عمل کرده؟
چرا مدیران سایت پرشین بلاگ هیچگاه از خود نمی پرسند چرا کمتر کسی در سایت آنها آگهی می دهد؟ من خودم یکبار در زمینه ترجمه ماشینی یک آگهی به سایت آنها دادم. اما نتیجه ای که گرفتم اصلا راضی کنند نبود و برای همین دیگر به آنها آگهی ندادم. بعد از این ومضوع به سایتهای دیگر بازهم آگهی دایدم که جواب مناسبی داشت اما روشی که پرشین بلاگ برای ارائه آگهی در نشر گرفته بود و همچنین هزینه در نشر گرفته جوابگوی تقاضای ما نبوید.
هستند بسیاری از افراد که با این نظر من م وافق باشند.
شاید بد نباشد که مدیران این سایت کمی هم فکر کنند که روشهای دیگری برای افزایش درآمد وجود دارد.
نمی توان با زور از مردم یا از شرکتها پول گرفت.
خود من بعد از این مسئله و از چندی قبل این سایت را گرفتم و ترجیح دادم به جای عوض کردن پارس آن لاین وبلاگم را جابجا کنم .
و جالب اینکه این سایت پرشین بلاک و ابزار های آن نتوانستند سایت مرا به مکان جدید منتقل کنند.
البته من همه کارهای پارس آن لاین را تائید نمی کنم و به کار آنها هم انتقاد دارم اما به نظر من بخش بازگانی این شرکت خیلی حرفه ای عمل کرده.
چه در زمانی که اعلام کرد کارت یک سایعته با کاربران می دهد برای بشته شدن سایتشان و چه زمانی که از کاربران خود بدلیل بسته شدن وبلاگ عذر خواهی کرد

توصیخ من به مدیران پرشین بلاگ این است که نظر خود راعوض کنند.
درست است که تعدادی از کاربران پرشین بلاگ پارس آنلاین را کنار گذاشته و به سرویس دهندگان دیگری روی آورده اند اما اینرا هم در نشر داشته باشند که بسیاری از دارندگان کارت های پارس آن لاین امکان دیدن وبلاگهای پرشین بلاگ را ندارند و این یعنی کاهش بازدید کنندگان سایت و کاهش درآمد تبلیعات بدلیل استقبال کمتر

به هر حال این تصمیم به ضرر هر دو سایت است و چه بسا بیشتر به ضرر سایت پرشین بلاگ چرا که پارس آن لاین توان فروش کارتهای خود را در این بازار دارد.

در ضمن توجه شمارا به مظلب زیر جلب می کنم
همه چيز درباره فيلترينگ سايتها
یک مصاحبه با پارس آن لاین و پرشین بلاگ و روابط عمومی مخابرات
حتما بخوانید

شنبه، اسفند ۰۹، ۱۳۸۲

سرمایه گذاری شرکت میکروسافت بر روی ترجمه ماشینی

شرکت میکروسافت بعنوان یک یپیشروترین شرکتهای نرم افزاری اعلام کرده که سیستم ترجمه ماشینی این شرکت برای ترجمه متون انگلیسی به اسپانیائی با موفقیت انجام شده و نتایج خوبی داشته است.
این شرکت با بیش از 6.8 بیلیون دلار هزینه در بخش تحقیقات و توسعه ، بیشترین سرمایه گذاری را در بین شرکتهای آی تی در این زمینه داشته است.
این شرکت بر روی پروژه ها ئی که بین 3 تا 9 سال طول میکشد سرمایه گذاری می کند.

منبع:
http://www.technologyreview.com/articles/wo_bender022704.asp
توضیح :
سرمایه گذاری بر روی پروژه هائی با بیش از 3 سال زمان اجرا نشان دهنده این است که این شرکت واقعا در نوک پیکان تکنولوژی آی تی قرار دارد. چرا که با رقابت شدید در این زمینه و همچنین مشخص نبودن آینده آی تی در دنبا می توان فهمید که در حقیقت این شرکت می تواند بعنوان یکی از پیشگامان صنعت آی تی آینده این صنعت را هم مشخص کند.

شنبه، اسفند ۰۲، ۱۳۸۲

درباره مترجم پارس

نرم افزار مترجم پارس

يك سيستم ترجمه ماشيني است كه متن انگليسي
را به جمله هاي فارسي ترجمه مي نمايد

اولين نگارش تجاري مترجم در شهريور ماه 1376 به عموم عرضه گرديد و آخرين نگارش ارتقاء يافته مترجم پارس در خرداد ماه 1381 ارائه شده است
در سيستم ورودي مترجم پارس، تايپ متن انگليسي يا انتخاب محتويات از يك فايل استفاده مي گردد
در حال حاضر، موتور مترجم پارس قادر به شناسايي و تجزيه بيش از يك ميليون و پانصدهزار واژه عمومي و اصطلاحات تخصصي متداول در 33 رشته علمي است
بانك واژگان و اصطلاحات مترجم پارس همواره در حال بهينه شدن و ارتقاء توسط همكاران ما در مراكز علمي و دانشگاهي مي باشد
در اين خط مشي، عضوهاي مترجم پارس مي توانند نگارش هاي ارتقاء يافته نرم افزار را با قيمت مخصوص و امكان استفاده از هشتاد درصد تخفيف ويژه اعضا تهيه نمايند

سه‌شنبه، بهمن ۱۴، ۱۳۸۲

دیکشنری انگلیسی به فارسی و برعکس با تلفظ

در سایت زیر می توانید از یک دیکشنری انگلیسی به فارسی با امکان تلفظ استفاده کنید.
ویژگی مهم این سایت استفاده از انواع مدینگهای موجود برای زبان فارس است. بطوریکه برای هر نوع سیستم عامل و کامپیوتری امکانات مناسبی برای خواندن فارسی ایجاد شده است.
http://www.iranianlanguages.com/dictionary.php?eng-per

چهارشنبه، بهمن ۰۸، ۱۳۸۲

یک فروم خوب برای مترجمین

در این فروم شمامی توانید با مقوله ترجمه شانا شده و بصورت رایگان به یادگیری آن بپردازید.
http://www.iransciland.com/trans

در حال حاضر این فروم در ابتدای کار است و امیدوارم که مدیران آن بتوانند اینکار را ادامه دهند.

چهارشنبه، دی ۱۷، ۱۳۸۲

مترجم پارس سرویس ترجمه متن خود را با استاندارد یونی کد ارائه کرد

سرویس مترجم پارس با استفاده از استاندارد یونی کد آماده و در اختیار کاربران سایت قرارخواهد گرفت.
نگارش آزمایشی این سرویس در آدرس زیر موجود می باشد.
http://www.ParsTranslator.Net/far/Motarjem2.htm
اطلاعات بیشتر درباره این سرویس در وبلاگ مترجم پارس در آدرس زیر موجود است.
http://www.ParsTranslator.Net/blog

راهنمای ترجمه متون غیر انگلیسی به زبان فارسی

در حال حاضر برنامه ای برای ترجمه متن فرانسه یا آلمانی یا اسپانیائی و ... به زبان فارسی وجود ندارد.
افرادی که به زبان انگلیسی یا یکی از این زبانها آشنائی داشته باشند می توانند با استفاده از مترجم آلتائیستا متن خود را به زبان دیگر ترجمه کرده و از متن ترجمه شده برای خواندن متن اصلی استفاده کنند.
اما فارسی زبانانی که حتی به زبان انگلیسی هم آشنائی ندارند می توانند با استفاده از مترجم آلتائویستا ابتدا متن خود را به زبان انگلیسی ترجمه کنند و سپس با استفاده از مترجم پارس متن انگلیسی را به فارسی ترجمه کنند.

برا ی ایتفاده از مترجم آلتاویستا می توانید از آدری زیر استفاده کنید:
http://babelfish.altavista.com

و برای ترجمه متن انگلیسی به فارسی هم می توانید از مترجم پارس در آدرس زیر استفاده کنید:
http://www.ParsTranslator.Net/far/motarjem.htm

البته با توجه به اینکه ترجمه اول و دوم هر دو دارای خطا هستند نباید انتظار یک ترجمه خوب را داشته باتشید اما برای فهم مطلب می تواند کمکی باشد
بعنوان مثال شاید خواندن یک متن ژاپنی برای بسیاری از افراد امکانپذیر نباشد اما خواندن ترجمه ماشینی آن به زبان انگلیسی یا فارسی می تواند کمک بزرگی باشد.