جمعه، مرداد ۰۴، ۱۳۸۷

وبلاگی در زمینه پردازش زبان طبیعی

وبلاگ پردازش زبان طبیعی به زبان فارسی قصد دارد که در زمینه پردازش زبان طبیعی و همچنین در زمینه بورسهای تحصیلی مرتبط با این رشته ( تا حد امکان ) اطلاعاتی را ارائه نماید. در این وبلاگ می توانید اخباری را در زمینه پردازش زبان طبیعی نیز دنبال کنید.

شنبه، اسفند ۰۴، ۱۳۸۶

بورس تحصیلی - معرفی چند دانشگاه

شاید شما هم از افرادی باشید که علاقه مند به ادامه تحصیل هستید ولی بدلیل مشکل مالی امکان رفتن به کشور دیگری برای تحصیل برای شما نیست. اما فراموش نکنید که اگر نمرات خوبی در دوره کارشناسی دارید و زبان انگلیسی یا زبان خارجی دیگری را بخوبی بلد هستید، می توانید از بورسهای تحصیلی خوبی که در اروپا به دانشجویان خارجی ارائه می شود استفاده کنید.
بورسهای زیادی وجود دارند که من در اینجا فقط مواردی را که به رشته کامپیوتر مربوط می شوند معرفی می کنم. البته در درجه اول سعی خواهم کرد اسم و آدرس دانشگاه را برای شما بگذارم و بعد در صورت تمایل شما می توانید اطلاعات بیشتری را از سایت دانشگاه بگیرید.

در مورد رشته های دیگر غیر ازکامپیوتر مثلامکانیک، برق، پزشکی، مدیریت و ... در صورت تمایل به من اطلاع بدهید تا آنها را نیز معرفی کنم.
این بورس معمولابصورت دوره دو ساله ارائه می شود که هر یال در یک کشور و دانشگاه است. رشته ای که می خواهم معرفی کنم در کشورهای اسپانیا، آلمان، ایتالیا و سوئد برگزار می شود.

عنوان این رشته مهندسینرم افزار است.
بورسی که ارائه می شود کل هزینه زندگی را پوشش خواهد داد. علاوه بر این اگر مجرد باشید و کمی صرفه جوئی کنید می توانید پس انداز هم داشته باشد و در تعطیلات بین ترم مسافرتی به کشورهای دیگر اروپائی بکنید.
در آینده در مورد اینکه چطور میتوانید برای این بورهای اقدام کنید خواهم نوشت. البته تمام اطلاعات در سایت معرفی شده وجود دارد و من بیشتر در مورد نگاتی صحبت خواهم کرد که برای اخذ پذیرش اهمیت دارد.

درسی با عنوان تکنولوژی زبان

دانشجویان ورودی به رشته زبانشناسی رایانه ای عموم از دو رشته زبانشناسی و کامپیوتر به این رشته می آیند. هرچند که ما امسال دانشجوئی داشتیم که رشته قبلی او مهندسی برق-مخابرات بود.
در هر صورت یکی از مهمترین مسائلی که در زشته های بین رشته ای وجود دارد، یکسان نبودن دانش دانشجویان است. در همین زمینه بایستی دروسی ارائه شوند که بتواند یک سری اطلاعات یکسان به دانشجویان ارائه کند.
یکی از این دروس درسی بود به نام تکنولوژی زبان
که بیشتر در زمنه کربردهای زبانشناسی و رایانه بحص می کرد. با توجه به تنوع مباحث مطرح شده، برای هر قسمت هم یک مدرس جدا در نظر گرفته شد. البته خوشبختانه ما ر دانشگاه از نظر هیئت علمی محدودیت نداشتیم بطوریکه حدود 10 نفر که چند تای آ«ها درجه استادی کامل داشتند این درس را ارائه دادند. بقیه هم در زمینه ارائه شده سالها بود که پژوهش می کردند.
برای آشنائی شما آدرس اسلایدهای ارائه شده را در اینجا ارائه می کنم.

علاوه بر این درس که برای یکسان سازی دانش مورد نیاز دانشجویان ارائه شده بود، درس دیگری هم ارائه شد که بیشتر جنبه عملی داشت و مباحص تئوری کمتر در آن مطرح شدند. این درس با عنوان پایه تکنولوژی و علم زبان مطرح شد.
بعضی از اسلایدهای ارائه شده را از آدرس زیر می توانید مطالعه کنید.
این درس هم مانند قبلی توسط اساتید متفاوتی ارائه شد. البته با توجه به محدود بودن زمان برای ارائه هر درس، فرصت مطالعه عمیق در هر زمینه نبود اما هدف کلی از ارائه این درس ، آشنائی دانشجویان با تکنولوژیهای زبان بود که در ترم بعد و همچنین برای پایان نامه دانشجویان بتوانند با دید بهتری در مورد زمینه مورد علاقه خودشان تصمیم بگیرند.

پنجشنبه، اسفند ۰۲، ۱۳۸۶

نئوری نحو

یکی از مواردی که به نظر من ما در ایران کمبود داریم، وجود افرادی است که علاوه بر دانش کامپیوتر به دانش زبانشناسی هم آشنا باشند یا برعکس
مثلا اگر فردی که تخصص کامپیوتر دارد بخواهد در زمینه پردزش زبانی کار کند و روش مورد استفاده هم شامل تحلیل دستوری زبان باشد، بایستی با مباحث کلاسیک تئوری دستور زبان آشنائی داشته باشد.
در آدرس زیر لینک اسلایدهای ارائه شده در دانشگاه سارلند را گذاشته ام. هم برای مدرسین درس زبانشناسی که به غیر زبانشناسان تدریس میکنند مفید است و هم برای افرادی که می خواهند اطلاعات بیشتری در زمینه زبانشناسی از دیدگاه دستور زبان داشته باشند.
Syntax Theory Slides
البته واقعا این مباحث برای افرادی که اطلاعات پایه زبانشناسی را ندارند کمی سخت است و باید وقت زیادی گذاشته شود. بخصوص مباحث مربوط بهHPSG و LFG

مدتی است که صحبت از راه انداختن رشته جدید زبانشناسی رایانه ای در دانشگاه تهران است. بنظر من یکی از مسائلی که خیلی مهم است طراحی دروس مناسب است.
یک روش اینست که از تجربیات دانشگاههای دیگر در این زمینه استفاده کنیم. دانشگاه سارلند به این دلیل که چند سالی است که این رشته را ارائه کرده است و همچنین دانشجویان آن از رشته های کامپیوتر و زبانشناسی و یا مهندسی برق می آیند توانسته تقریبا در این زمینه کار خوبی ارائه دهد.
هرچند بدلیل کمبود تجربیات مناب در زمینه پردازشهای زبانی در زبان فارسی، همیشه مشکل تئوری بودن این دروس وجود دارد و کمتر می توان دروس عملی در ایران در این زمینه تعریف کرد.
بعنوان مثال کار ساده ای نیست که بخواهیم شبکه عصبی را به افرادی که دانش برنامه نویسی قوی ندارند بدون ابزار تدریس کنیم.
هرچند در حال حاضر برنامهمتن-باز زیادی در اینترت وجود دارد که کاربرد آموزشی دارد و می تواند برای آموزش در این زمینه مورد استفاده قرار گیرد. نمونه بارز آنهم برنامه تولکیت پردازش زبان است
NLTK

دوشنبه، بهمن ۲۹، ۱۳۸۶

بورس تحصیلی

یکی از مواردی که در یان وبلاگ در می خواهم بنویسم اینه که چطور میشه این بورسی که من گرفتن را شما هم بگیرید؟
واقعیت اینه که من با بورسی از اتحادیه اروپا اومدم آلمان برای دوره کارشناسی ارشد.
چند سال است که اتحادیه اروپا برای جذب نیروی متخصص و ماهر در دانشگاهها بورسهای خوبی را به متقاضیان غیر اروپائی می دهد. یکی از این بورسها با نام موندوس خیلی قدیمی است و چند سالی است که برای غیر اروپائی ها هم ارائه شده است.
http://ec.europa.eu/education/programmes/mundus/index_en.html
سری به این سایت بزندید تا در فرصت مناسب در مورد این بورس تحصیلی بیشتر توضیح بدم.
در ضمن الان غیر از این بورس، برای افراد علاقه مند بورسهای دیگری هم وجود دارد که راه پیدا کردن و اقدام برای آنها را هم در آینده توضح خواهم داد.

زبان فارسی

شاید اولین سوالی که بتوان مطرح کرد اینست که چرا تابحال بر روی زبان فارسی کار زیادی انجام نشده است؟
اول از همه از تجربه قبلی خودم در زمینه ترجمه ماشینی شروع کنم.
چرا در زمینه ترجمه ماشینی فارسی تعداد شرکتهای فعال یا دانشگاههای فعال کم است؟
آیا متقاضی این محصول کم است؟ تا آنجا که می دانم تقاضای موجود کم نیست. بخصوص اینکه حجم زیادی از مطالب منتظر شده در اینترنت به زانی غیر از فارسی است و بسیاری از ایرانیان آشنائی کافی به زبانهای دیگرندارند.

از مدتها پیش پرژه ای مانند ترجمه ماشینی بعنوان پروژه ملی در سطوح بالای مملکت مطرح شده و تصویب شده است. این پروژه مصوب مجمع تشخیص مصلجت + شورای عالی انقلاب فرهنگی است.