چهارشنبه، آذر ۰۸، ۱۳۸۵
NIST 2005 Machine Translation Evaluation Official Results
موسسه نیست هر ساله سیستمهای ترجمه ماشینی را بر اساس روشهای استاندارد، از نظر کیفیت نتایج مورد ارزیابی قرار می دهد.
طبق این ارزیابی مترجم گوگل در زمینه ترجمه زبان عربی بالاترین رتبه را داشته است.
برای مشاهده همه نتایج به آدرس زیر مراجع هنمائید.
این ارزیابی در سال 2006 هم انجام شده است. البته ارزیابی 2006 در گروههای مختلف انجام شده و بعنوان مثال شرکت اپ تک توانسته در ترجمه متون گروههای خبری رتبه بهتری نسبت به مترجم گوگل بدست آورد.
نتایج ارزیابی ترجمه ماشینی سال 2006 موسسه نیست
سهشنبه، آبان ۳۰، ۱۳۸۵
English to Persian (Farsi) Pars SMS Translator
یکشنبه، آبان ۲۱، ۱۳۸۵
Farsi Speech to Speech translation
نرم افزار مترجم صوتی گفتار به گفتار زبان فارسی طراحی و ساخته شد
با دستيابي متخصصان يك شركت داخلي به فنآوري پيشرفته طراحي و ساخت نرم افزار تشخيص گفتار مستقل از گوينده، امكان ترجمه مستقيم گفتار فارسي به گفتار معادل در زبانهاي انگليسي و عربي فراهم شد. مهندس باقر بابا علي، دانشجوي دكتري كامپيوتر دانشگاه صنعتي شريف و مدير بخش تحقيقات شركت سازنده اين نرم افزار درباره كاربردهاي نرم افزار طراحي شده گفت: به كمك اين نرم افزار افراد مي توانند بدون دانستن زبان خارجي نيازهاي ابتدايي خود را برآورده كنند. براي مثال براي پرسيدن ساعت صبحانه، مراكز خريد، يك رستوران خوب يا قيمت لباس ميتوان به زبان فارسي صحبت كرد و رايانه بعد از درك كلمه، معادل آن در زبان مقصد را بيان ميكند. وي خاطرنشان كرد: جنبه ديگر اين نرم افزار كمك به آموزش زبان و يادگيري عبارات مورد استفاده در مكالمات روزمره است. در مترجم صوتي گفتار به گفتار «پارسيا» جملات و عبارات بيان شده توسط كاربر مستقيماً به گفتار معادل در زبانهاي انگليسي و عربي ترجمه و بيان ميشود تا به زبان مورد نظر ترجمه شود. در نسخه جاري اين نرمافزار گفتار فارسي مستقيما به گفتار معادل در زبانهاي انگليسي و عربي ترجمه ميشود. باباعلي تصريح كرد: ويژگي و هسته اصلي اين مترجم، يك سيستم تشخيص خودكار گفتار فارسي است كه گفتار كاربر را پردازش كرده و آن را تشخيص ميدهد، سپس گفتار تشخيص داده شده به معادل خود در زبان مقصد برگردانده ميشود. اين ويژگي «پارسيا» را به عنوان اولين نرم افزار فارسي با قابليت تشخيص گفتار از همه نرم افزارهاي ديگر متمايز ميكند. وي با بيان اين كه اين نرم افزار در دو نسخه قابل نصب روي PC و كامپيوترهاي جيبي (PDA) توسعه داده شده است، گفت: متخصصان اين شركت با دستيابي به فنآوري طراحي و ساخت نرمافزار تشخيص گفتار مستقل از گوينده، نرم افزاري نيز براي تايپ گفتار فارسي طراحي كردهاند كه قادر است گفتار كاربران را كه از طريق ميكروفن به رايانه منتقل ميشود به در محيط word، notpad يا هر صفحه ويرايشي كه امكان تايپ فارسي در آن وجود دارد، بنويسد. باباعلي خاطر نشان كرد: از كاربردهاي جانبي اين سيستم - علاوه بر استفاده به جاي تاپيست -، استفاده توسط پزشكان جهت تهيه گزارش يا نسخه دارو، نوشتن اسناد حقوقي توسط وكلا يا تايپ ساير متون تخصصي در زمينههاي مختلف است كه در اين راستا نسخه تخصصي نرم افزار نويسا (تايپ گفتاري) به منظور استفاده متخصصان قلب در نوشتن نسخه توسعه داده شده كه اين قبيل نمونههاي تخصصي نرم افزار به دليل اختصاصي بودن و كاهش دامنه كلمات از دقت و كارايي به مراتب بالاتري برخوردارند.
چهارشنبه، آبان ۱۷، ۱۳۸۵
Google Machine Translation
شرکت گوگل توانسته است مترجم ماشینی برای زبان انگلیسی چینی و عربی را توسط تیمی تولید کند که هیچکدام از آنها با زبانهای عربی و چینی آشنائی ندارند.
بنظر مشا چطور چنین کاری امکانپذیر است؟ در سیستمهای ترجمه ماشینی که قبلا طراحی شده اند همیشه تعدادی کارشناس زبانشناسی در کنار تیمها طراحی نرم افزار وجود دارند که تسلط کامل به زبان مقصد یا مبدا دارند. در این سیستمها معمولا اطلاعاتی زبانشناختی نقش اصلی در اطلاعات ورودی به سیستم را بازی می کند.
اما یکی از روشهائی که امروزه مورد استفاده شرکتهای مختلف قرار گرفته استفاده از متون از قبل ترجمه شده و مدلهای آماری برای ترجمه ماشینی است.
اولین کار در این زمینه در شرکت آی بی ام انجام شده است. اما در حال حاضر گوگل بدلیل دسترسی به حجم زیادی از متون زبان طبیعی توانسته مجموعه ای از بهترین سیستمهای ترجه ماشینی را با استفاده از روش آماری راائه دهد.
البته هنوز برای زبان فارسی بطور رسمی این شرکت مترجم یارائه نداده است. اما می توان انتظار داشت که با سرمایه گذاری وزارت دفاع آمریکا این سیستم ترجمه انگلیسی - فارسی هم بزودی ارائه شود.
واقعیت این است که شرکتهائی مانند گوگل بدلیل دسترسی به حجم بسیار بالائی از اطلاعات ، توانائی انجام بسیاری از پروژه هائی را دارند که دیگران فقط بدلیل عدم دسترسی به این اطلاعات ( بدلیل هزینه زیاد گردآوری آن) نمی توانند انجام دهند.
اما مهم این است که امکان دسترسی به حجم اطلاعات طبقه بندی شده اینترنت در اختیار پروژه های انجام نشده ای چون ترجمه ماشینی قرار گرفته و در نهایت به نفع کاربران اینترنت خواهد شد.
در ایران هم شرکتهای کامپیوتری با استفاده از روشهای آماری در زمینه ترجمه ماشینی کارهائی انجام داده اند اما بدلیل هزینه زیاد تهیه متون ترجمه شده، هزینه پروژه بالا رفته و روز بروز انجام کار برای آنها سخت تر می شود.
لینک خبر:
Google tops translation ranking