چهارشنبه، دی ۰۱، ۱۳۸۹

PhD scholarship - Machine Translation, Speech Recognition and NLP - Deadline 9 Jan 2011

The ?Human Language Technologies? Research Unit of Bruno Kessler Foundation (FBK)
is seeking  candidates for three research internship positions in the following areas:

-  Statistical Machine Translation
-  Automatic Speech Recognition
-  Software development for NLP

The internship are intended to provide a strong theoretical and experimental background to graduate
students interested in applying for a PhD scholarship to start in June 2011.

Requirements,  salary, and  application procedure are specified  in
http://risorseumane.fbk.eu/sites/risorseumane.fbk.eu/files/Call%20HLT_INTERNSHIP2011.pdf

Closing date: 9 January 2011

دوشنبه، آبان ۰۳، ۱۳۸۹

بورس دکترا ۲۰۱۱

با عضویت در گروه بورس دکترا در زمینه پردازش زبان طبیعی، آخرین بورسهای دکترا در زمینه کامپیوتر و پردازش زبان طبیعی به ایمیل شما ارسال خواهد شد. البته در صورت تمایل می توانید بدون عضویت تمام بورسهای دکترا ارسال شده به گروه را ببینید. 

  • تمامی بورسهای معرفی شده معمولا فقط نیاز به دانش زبان انگلیسی دارد و دانستن زبان کشور مقصد الزامی نسیت.
  • این بورسها برای تمامی افرادی که در رشته های کامپیوتر و یا مترجمی زبان یا زبانشناسی تحصیل کرده باشند مناسب است. 
  • در این لیست می توانید بورسهای فوق لیسانس در زمینه پردازش زبان طبیعی را هم مشاهده کنید.

پنجشنبه، مرداد ۲۸، ۱۳۸۹

Proceedings of the Joint Fifth Workshop on Statistical Machine Translation and MetricsMATR

مجموعه مقالات پنجمین کارگاه ترجمه ماشینی آماری و روشهای ارزیابی ترجمه ماشینی


به تدریح و با خواندن مقالات سعی خواهم کرد خلاصه ای از هر کدام را در زیر همین لیست تکمیل کنم. این مقالات برای کسانی که علاقه مند به کار در زمینه ترجمه ماشینی هستند بسیار مفید خواهد بود چرا که مقایسه ای بین آخرین روشهای ترجمه ماشینی در دنیا انجام شده است. همه سیستمها با یک داده و مکانیزمهای مشابه مورد ارزیابی قرار گرفته اند.

W10-17 [bib]: Entire volume
W10-1700: Front Matter
W10-1701 [bib]: Qin Gao; Nguyen Bach; Stephan Vogel
A Semi-Supervised Word Alignment Algorithm with Partial Manual Alignments
W10-1702 [bib]: Boxing Chen; George Foster; Roland Kuhn
Fast Consensus Hypothesis Regeneration for Machine Translation
W10-1703 [bib]: Chris Callison-Burch; Philipp Koehn; Christof Monz; Kay Peterson; Mark Przybocki; Omar Zaidan
Findings of the 2010 Joint Workshop on Statistical Machine Translation and Metrics for Machine Translation
مقاله بالا گزارشی از ارزیابی کلیه سیستمهای ترجمه ماشینی شرکت کننده در این کارگاه است. علاوه بر این روشهای مختلف ارزیابی ترجمه ماشینی هم ارزیابی شده اند با این هدف که بدانیم کدام روش به ارزیابی انسانی نزذیک تر است.  
 
W10-1704 [bib]: Alexandre Allauzen; Josep M. Crego; \.Ilknur Durgar El-Kahlout; Francois Yvon
LIMSI’s Statistical Translation Systems for WMT’10
W10-1705 [bib]: Ondřej Bojar; Kamil Kos
2010 Failures in English-Czech Phrase-Based MT
W10-1706 [bib]: Cong Hui; Hai Zhao; Bao-Liang Lu; Yan Song
An Empirical Study on Development Set Selection Strategy for Machine Translation Learning
W10-1707 [bib]: Vladimir Eidelman; Chris Dyer; Philip Resnik
The University of Maryland Statistical Machine Translation System for the Fifth Workshop on Machine Translation
W10-1708 [bib]: Christian Federmann; Andreas Eisele; Yu Chen; Sabine Hunsicker; Jia Xu; Hans Uszkoreit
Further Experiments with Shallow Hybrid MT Systems
W10-1709 [bib]: Greg Hanneman; Jonathan Clark; Alon Lavie
Improved Features and Grammar Selection for Syntax-Based MT
W10-1710 [bib]: Christian Hardmeier; Arianna Bisazza; Marcello Federico
FBK at WMT 2010: Word Lattices for Morphological Reduction and Chunk-Based Reordering
W10-1711 [bib]: Carmen Heger; Joern Wuebker; Matthias Huck; Gregor Leusch; Saab Mansour; Daniel Stein; Hermann Ney
The RWTH Aachen Machine Translation System for WMT 2010
W10-1712 [bib]: Carlos A. Henríquez Q.; Marta Ruiz Costa-jussà; Vidas Daudaravicius; Rafael E. Banchs; José B. Mariño
Using Collocation Segmentation to Augment the Phrase Table
W10-1713 [bib]: Stéphane Huet; Julien Bourdaillet; Alexandre Patry; Philippe Langlais
The RALI Machine Translation System for WMT 2010
W10-1714 [bib]: Michael Jellinghaus; Alexandros Poulis; David Kolovratník
Exodus - Exploring SMT for EU Institutions
W10-1715 [bib]: Philipp Koehn; Barry Haddow; Philip Williams; Hieu Hoang
More Linguistic Annotation for Statistical Machine Translation
W10-1716 [bib]: Patrik Lambert; Sadaf Abdul-Rauf; Holger Schwenk
LIUM SMT Machine Translation System for WMT 2010
W10-1717 [bib]: Samuel Larkin; Boxing Chen; George Foster; Ulrich Germann; Eric Joanis; Howard Johnson; Roland Kuhn
Lessons from NRC’s Portage System at WMT 2010
W10-1718 [bib]: Zhifei Li; Chris Callison-Burch; Chris Dyer; Juri Ganitkevitch; Ann Irvine; Sanjeev Khudanpur; Lane Schwartz; Wren Thornton; Ziyuan Wang; Jonathan Weese; Omar Zaidan
Joshua 2.0: A Toolkit for Parsing-Based Machine Translation with Syntax, Semirings, Discriminative Training and Other Goodies
W10-1719 [bib]: Jan Niehues; Teresa Herrmann; Mohammed Mediani; Alex Waibel
The Karlsruhe Institute for Technology Translation System for the ACL-WMT 2010
W10-1720 [bib]: Sergio Penkale; Rejwanul Haque; Sandipan Dandapat; Pratyush Banerjee; Ankit K. Srivastava; Jinhua Du; Pavel Pecina; Sudip Kumar Naskar; Mikel L. Forcada; Andy Way
MATREX: The DCU MT System for WMT 2010
W10-1721 [bib]: Aaron Phillips
The Cunei Machine Translation Platform for WMT ’10
W10-1722 [bib]: Juan Pino; Gonzalo Iglesias; Adrià de Gispert; Graeme Blackwood; Jamie Brunning; William Byrne
The CUED HiFST System for the WMT10 Translation Shared Task
W10-1723 [bib]: Marion Potet; Laurent Besacier; Hervé Blanchon
The LIG Machine Translation System for WMT 2010
W10-1724 [bib]: Markus Saers; Joakim Nivre; Dekai Wu
Linear Inversion Transduction Grammar Alignments as a Second Translation Path
W10-1725 [bib]: Germán Sanchis-Trilles; Jesús Andrés-Ferrer; Guillem Gascó; Jesús González-Rubio; Pascual Martínez-Gómez; Martha-Alicia Rocha; Joan-Andreu Sánchez; Francisco Casacuberta
UPV-PRHLT English–Spanish System for WMT10
W10-1726 [bib]: Lane Schwartz
Reproducible Results in Parsing-Based Machine Translation: The JHU Shared Task Submission
W10-1727 [bib]: Sara Stymne; Maria Holmqvist; Lars Ahrenberg
Vs and OOVs: Two Problems for Translation between German and English
W10-1728 [bib]: Jörg Tiedemann
To Cache or Not To Cache? Experiments with Adaptive Models in Statistical Machine Translation
W10-1729 [bib]: Sami Virpioja; Jaakko Väyrynen; Andre Mansikkaniemi; Mikko Kurimo
Applying Morphological Decompositions to Statistical Machine Translation
W10-1730 [bib]: Zdeněk Žabokrtský; Martin Popel; David Mareček
Maximum Entropy Translation Model in Dependency-Based MT Framework
W10-1731 [bib]: Francisco Zamora-Martinez; Germán Sanchis-Trilles
UCH-UPV English–Spanish System for WMT10
W10-1732 [bib]: Daniel Zeman
Hierarchical Phrase-Based MT at the Charles University for the WMT 2010 Shared Task
W10-1733 [bib]: Baskaran Sankaran; Ajeet Grewal; Anoop Sarkar
Incremental Decoding for Phrase-Based Statistical Machine Translation
W10-1734 [bib]: Fabienne Fritzinger; Alexander Fraser
How to Avoid Burning Ducks: Combining Linguistic Analysis and Corpus Statistics for German Compound Processing
W10-1735 [bib]: Arianna Bisazza; Marcello Federico
Chunk-Based Verb Reordering in VSO Sentences for Arabic-English Statistical Machine Translation
W10-1736 [bib]: Hideki Isozaki; Katsuhito Sudoh; Hajime Tsukada; Kevin Duh
Head Finalization: A Simple Reordering Rule for SOV Languages
W10-1737 [bib]: Ronan Le Nagard; Philipp Koehn
Aiding Pronoun Translation with Co-Reference Resolution
W10-1738 [bib]: David Vilar; Daniel Stein; Matthias Huck; Hermann Ney
Jane: Open Source Hierarchical Translation, Extended with Reordering and Lexicon Models
W10-1739 [bib]: Loïc Barrault
MANY: Open Source MT System Combination at WMT’10
W10-1740 [bib]: Ergun Bicici; S. Serdar Kozat
Adaptive Model Weighting and Transductive Regression for Predicting Best System Combinations
W10-1741 [bib]: Ergun Bicici; Deniz Yuret
L1 Regularized Regression for Reranking and System Combination in Machine Translation
W10-1742 [bib]: Jinhua Du; Pavel Pecina; Andy Way
An Augmented Three-Pass System Combination Framework: DCU Combination System for WMT 2010
W10-1743 [bib]: Jesús González-Rubio; Germán Sanchis-Trilles; Joan-Andreu Sánchez; Jesús Andrés-Ferrer; Guillem Gascó; Pascual Martínez-Gómez; Martha-Alicia Rocha; Francisco Casacuberta
The UPV-PRHLT Combination System for WMT 2010
W10-1744 [bib]: Kenneth Heafield; Alon Lavie
CMU Multi-Engine Machine Translation for WMT 2010
W10-1745 [bib]: Almut Silja Hildebrand; Stephan Vogel
CMU System Combination via Hypothesis Selection for WMT’10
W10-1746 [bib]: Sushant Narsale
JHU System Combination Scheme for WMT 2010
W10-1747 [bib]: Gregor Leusch; Hermann Ney
The RWTH System Combination System for WMT 2010
W10-1748 [bib]: Antti-Veikko Rosti; Bing Zhang; Spyros Matsoukas; Richard Schwartz
BBN System Description for WMT10 System Combination Task
W10-1749 [bib]: Alexandra Birch; Miles Osborne
LRscore for Evaluating Lexical and Reordering Quality in MT
W10-1750 [bib]: Elisabet Comelles; Jesus Gimenez; Lluis Marquez; Irene Castellon; Victoria Arranz
Document-Level Automatic MT Evaluation based on Discourse Representations
W10-1751 [bib]: Michael Denkowski; Alon Lavie
METEOR-NEXT and the METEOR Paraphrase Tables: Improved Evaluation Support for Five Target Languages
W10-1752 [bib]: Marcus Dobrinkat; Tero Tapiovaara; Jaakko Väyrynen; Kimmo Kettunen
Normalized Compression Distance Based Measures for MetricsMATR 2010
W10-1753 [bib]: Yifan He; Jinhua Du; Andy Way; Josef van Genabith
The DCU Dependency-Based Metric in WMT-MetricsMATR 2010
W10-1754 [bib]: Chang Liu; Daniel Dahlmeier; Hwee Tou Ng
TESLA: Translation Evaluation of Sentences with Linear-Programming-Based Analysis
W10-1755 [bib]: Billy Wong; Chunyu Kit
The Parameter-Optimized ATEC Metric for MT Evaluation
W10-1756 [bib]: Abhishek Arun; Barry Haddow; Philipp Koehn
A Unified Approach to Minimum Risk Training and Decoding
W10-1757 [bib]: Kevin Duh; Katsuhito Sudoh; Hajime Tsukada; Hideki Isozaki; Masaaki Nagata
N-Best Reranking by Multitask Learning
W10-1758 [bib]: Ralf Brown
Taming Structured Perceptrons on Wild Feature Vectors
W10-1759 [bib]: Kashif Shah; Loïc Barrault; Holger Schwenk
Translation Model Adaptation by Resampling
W10-1760 [bib]: Michael Paul; Andrew Finch; Eiichiro Sumita
Integration of Multiple Bilingually-Learned Segmentation Schemes into Statistical Machine Translation
W10-1761 [bib]: Hieu Hoang; Philipp Koehn
Improved Translation with Source Syntax Labels
W10-1762 [bib]: Katsuhito Sudoh; Kevin Duh; Hajime Tsukada; Tsutomu Hirao; Masaaki Nagata
Divide and Translate: Improving Long Distance Reordering in Statistical Machine Translation
W10-1763 [bib]: Rabih Zbib; Spyros Matsoukas; Richard Schwartz; John Makhoul
Decision Trees for Lexical Smoothing in Statistical Machine Translation

دوشنبه، خرداد ۱۷، ۱۳۸۹

یک بورس دکترا و دو فوق دکترا در زمینه ترجمه ماشینی - فرانسه

The computer science laboratory of the University of Le Mans (LIUM) has openings for two postdoc and one PhD position in the field of statistical machine translation.

LIUM performs research in statistical machine translation since several years and we are particularly interested in new machine learning methods. Ongoing work includes continuous space language and translation models, unsupervised training, comparable corpora, translation model adaptation, domain specific models, integration of linguistic knowledge, etc.

LIUM is involved in several international projects, in particular EuromatrixPlus, Gale and several French national projects (e.g. http://www.cosmat.fr). We have very successfully participated in several international evaluations, in particular NIST'09 or WMT'10. A large computer cluster is available to support the research.

The postdoc positions are immediately available and the PhD will start in October 2010. Competitive salaries are available. Postdoc candidates must have a proven experience in machine learning, NLP and SMT, ideally with the Moses decoder. We are very actively working on large systems to translate from Arabic and Chinese and we are therefore interested in a postdoc with knowledge in one of those languages.

Le Mans is located in between Paris and the Atlantic ocean. Both can be reached in about 1 hour by high speed train. The Loire valley with many wineries and other attractions is just a short drive away ...

For information, please contact Holger Schwenk by email: Holger.Schwenk@lium.univ-lemans.fr

پنجشنبه، خرداد ۰۶، ۱۳۸۹

چهارشنبه، اردیبهشت ۲۲، ۱۳۸۹

Could Twitter Data Replace Opinion Polls? [STUDY]

Does Google TTS can help us to learn new language?



آیا سرویس جدید متن به صدا گوگل می تواند به ما برای آموزش یک زبان جدید کمک کند؟

بله می تواند. این سرویس می تواند یک کلمه فرانسه را بخوبی تلفظ کند و به فرد متقاضی بدون نیاز به یک معلم تمام وقت امکان یادگیری زبان جدید را بدهد.

برای خود من زمانیکه متن انگلیسی را به فرانسه ترجمه می کردم که بتوانم در جائی استفاده کنم، مشکل جدید این بود که گاهی نمی دانستم که بعضی از کلمه ها را چطور تلفظ کنم. با این ابزار جدید این مشکل هم کم‌رنگ شده است.

اما همانطور در اینجا نوشته شده، به‌هر حال ابزارهای ترجمه هنوز نمی‌توانند کاملا جایگزین یک برنامه آموزش زبان  بشوند.

دوشنبه، اردیبهشت ۱۳، ۱۳۸۹

Google TV

ظاهرا بازار موتور جستجوی متن قرار نیست بیشتر از این رشد کنه و بیشتر شرکتها دنبال موتورهای جستجوی فیلم و تصویر هستند. خوب در این میان هم شرکت گوگل قصد داره اول تلویزیون خودش را اقتتاح کنه و بعد هم حتما موتور جستجوئی را معرفی میکنه که بتونه فیلم یا حتی فریم مورد نظر شما در یک فیلم را پیدا کنه.

الان بیشتر شرکتهای معروف در زمینه جستجو دارند روی تکنولوژی های جستجوی مالتی مدیا کار میکنند. به این معنی که مثلا یک آهنگی را زمزمه کنید و خواننده و ترک آهنگ را پیدا کنید. یا اینکه دنبال کلمه های کلید توی فیلمها بگردید و مثلا ببینید در یک زمینه خاص در کدام فیلمها و چه زمانهائی صحبت شده یا تصویری نشان داده شده.


سه‌شنبه، فروردین ۲۴، ۱۳۸۹

Receiver operating characteristic - Wikipedia, the free encyclopedia

Receiver operating characteristic - Wikipedia, the free encyclopedia

معیاری برای اندازه گیری کارآئی یک سیستم یادگیری ماشین - بخصوص برای دسته بندی

RWTH ASR - The RWTH Aachen University Speech Recognition System

RWTH ASR - The RWTH Aachen University Speech Recognition System
یک سیستم تبدیل صورت به متن که بصورت اوپن سورس ارائه شده است.
این سیستم متعلق به دانشگاه آخن در آلمان است. توسعه دهندگان این سیستم اعلام کرده اند که این سیستم را برای پروژه ترجمه ماشینی خودشان نیز استفاده کرده اند.

دوشنبه، فروردین ۲۳، ۱۳۸۹

Scholarship position

Scholarship position
یک سایت _ وبلاگ ) خوب در زمینه بورسهای دکترا در آمریکا و اروپا و کانادا و بقیه جاهای دنیا.

معمولا برای اینکه بتوانیم یک بورس خوب در زمینه مورد علاقه خودمان بگیریم در درج اول باید تعداد زیادی گزینه را انتخاب کرده و بعد از بین آنها برای مواردی که شانس بیشتری داریم اقدام کنیم. هرچند اقدام کردن برای دوره های اروپائی در بیشتر موارد تقریبا رایگان است. تقریبا برای اینکه شما باید هزینه های ترجمه و پست را بالاخره بپردازید. و صد البته وقت زیادی بگذارید تا نامه های خواسته شده را هم آماده کنید.

البته کلا اقدام کردن برای بیشتر از 3-5 مورد در یک سال منطقی نیست. چون توصیه نامه هائی که باید بگیرید شما را می تواند دچار مشکل کند. بعنوان مثال نمی توان انتظار داشت که یک استاد به شما سالی 10 توصبه نامه بدهد. توجه داشته باشید که دانشگاهای زیادی هستند که فرم خاص توسه نامه دارند و برای همین باید برای هر کدام جداگانه از اساتید خودتان تقاضا کنید که کار ساده ای نیست . برای همین توصیه میکنم که بیشتر از 3-5 مورد را برای یکسال انتخاب نکنید. برای اینکه انتخاب خوبی داشته باشید داشتن لیست بلند بالا از دانشگاهها و برنامه های که می توانید اقدام کنید می تواند خیلی مفید باشد.


پنجشنبه، فروردین ۱۹، ۱۳۸۹


اگر علاقه مند به دریافت آخرین بورسها در زمینه پردازش زبان طبیعی هستید به این گروه در گوگل سر بزنید و عضو بشین.
ایمیلهای مربوط به این زمینه را که از طرف اساتید دانشگاهم برای من فرستاده میشه را برای شما می فرستم.

چهارشنبه، اسفند ۱۲، ۱۳۸۸

New languages for Microsoft Translator - Bing Translator

شرکت میکروسافت اعلام کرده است که هفت زبان جدید به مترجم ماشنی این شرکت اضافه شده است. از این به بعد می توانید از این مترجم برای زبانهای رومانیائی، نروژی، ... و همچنین زبان ترکی استفاده کنید. متاسفانه هنوز زبان فارسی توسط این سرویس ترجمه پشتیبانی نمی شود.
این مترجم می تواند علاوه بر ترجمه متن، یک سایت کامل را هم برای شما ترجمه کند. علاوه بر این برنامه نویسان یا دارندگان وب سایت می توانند این ابزار را بصورت مستقیم در برنامه یا سایت خودشان استفاده کنند.

اگر مایل به کسب اطلاعات بیشتر در این زمینه بودید، در زیر همین پست برای من نظر بگذارید.

Automatic Translation now in Chrome

بالاخره گوگل سرویس ترجمه اتوماتیک ( ترجمه ماشینی ) را در مرورگر اینترنت خودش یعنی کروم اضافه کرد. از این به بعد برای دیدن صفحاتی که به زبان دیگری هستند مشکلی ندارید. کروم بصورت خودکار متن هر سایتی را به زبان مورد نظر شما ترجمه میکند. اگر قبلا برای انجام اینکار نیاز به نصب پلاگین در فایر فاکس یا اینترنت اکسپلورر داشتید، یا اینکه آدرس سایت را در سایت مترجم گوگل کپی می کردید، الان دیگر نیازی نیست.
فقط کافیه که آخرین نگارش مرورگر کروم را نصب کنید و از این امکان جدید استفاده کنید.

در این روش ظاهرا مشکلی نباید باشه و بنظر میاد که کاملا مشکل چند زبانه بودن محیط اینترنت حل شده است. اما نه اینطور نیست. مشکل اینه که سیستمهای ترجمه ماشینی عموما ترجمه دقیق به شما نمی دهد و شما فقط می توانید ( با تکنولوژی امروز ) یک ایده بگیرید که سایت در چه زمینه ای هست . 
در ضمن شاید شما در حین آموزش یک زبان جدید باشید و دوست داشته باشید که بدانید چه جمله ای در مثلا زبان فرانسه به جمله مادل فارسی ترجمه شده، در اینصورت می توانید از ابزارهای ترجمه آنلاین استفاده کنید که به شما نشان می دهد که چه چیزی به چه چیزی ترجمه شده است. سیستم مترجم گوگل ( در سایت اصلی آن ) در حال حاضر این امکان را برای شما فراهم میکند. 

اگر می خواهید این سیستم را در هر صفحه اینترت داشته باشید هم می توانید تولبار مترجم را از آدرس زیر دانلود کنید و از سیستم ترجمه فارسی به انگلیسی، فرانسه و آلمانی و برعکس آن استفاده کنید.

سه‌شنبه، اسفند ۱۱، ۱۳۸۸

Job, Software engineer, Language Technology, Germany, Saarbrucken

Job, Software engineer, Language Technology, Germany, Saarbrucken
شهر زارلند، بعنوان یکی از مراکز مهم آزمایشگاه تحقیقانی DFKI می تواند مکان مناسبی برای محققینی باشد که علاقه مند هستند در زمینه پردازش زبان طبیعی و تکنولوژی زبان تحقیق کنند.
این شغل نیاز به مدرک کارشناسی ارشد با دکترا در زمینه نرم افزار و تکنولوژی زبان دارد.

پنجشنبه، بهمن ۲۹، ۱۳۸۸

Google image translation in mobile

اریک اشمیت پروژه جدید گوگل در بازار موبایل را نشان داده است که می تواند متون موجود در عکس را تشخیص داده و آنرا با مترجم ماشینی گوگل، ترجمه کند. با این تکنولوژی شما می توانید از هر متنی که خواستید توسط دوربین موبایل عکس گرفته و آنرا توسط همان موبایل ترجمه کنید. 
البته بدیهی است که این سرویس در آینده بر روی گوشی هائی ارائه خواهد شد که سیستم عامل آندروید را دارند. در ضمن این سرویس فعلا برای ترجمه ماشینی انگلیسی - آلمانی ارائه شده است.
در این سروی علاوه بر ترجمه ماشینی گوگل از سرویس تشخیص نوری حروف یا او سی آر (Optical Character Recognition) نیز استفاده شده است.

با ورود شرکتهای گوگل و میکروسافت به بازار موبایل، میتوان انتظار داشت که رشد این صنعت روز بروز بیشتر شده و امکانات جدیدی را در گوشیهای جدید چه از نظر سخت افزار و چه ار نظر نرم افزار داشته باشیم.

ترجمه عکس با موبایل گوگلی

جمعه، بهمن ۲۳، ۱۳۸۸

Introduction to Information Retrieval book - pdf copy

اخیرا کتاب مقدمه ای بر بازیابی اطلاعات  بصورت آنلاین ارائه شده است. شما می توانید این کتاب را بصورت آنلاین بخوانید یا اینکه آنرا بصورت یک فایل پی دی اف دانلود کنید. این کتاب بطور کامل آخرین تکنولوژیهای استفاده شده در زمینه بازیابی اطلاعات را پوشش می دهد. از نویسندگان این کتاب قبلا کتاب مقدمه ای بر پردازش آماری زبان طبیعی ارائه شده بود که آن کتاب هم به نوع خودش یک کتاب کامل در زمینه پردازش زبان طبیعی بود و در بسیاری از دانشگاههای دنیا تدریس می شد.
برای دانلود این کتاب می توانید از لینک زیر استفاده کنید.

http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf

کار با ارزشی که اینروزها برای بسیاری از کتابهای دانشگاهی انجام می شود ( و برای این کتاب هم شده است ) ارائه اسلایدهای تدریس است. به اینصورت مدرس این کتاب نیازی به صرف وقت برای آماده سازی اسلاید ندارد و به سادگی می تواند از اسلایدهای آماده همراه کتاب استفاده کند. یا اینکه حداکثر آنها را ویرایش جزئی کند. 
اسلایدهای این کتاب را می توانید از این آدرس دانلود کنید.


یا اینکه به سایت اصلی کتاب رفته و نسخه های مختلف آنرا بررسی و سپس دانلود کنید. 

چهارشنبه، بهمن ۲۱، ۱۳۸۸

Disney Research looking for internship

شرکت دیزنی در بخش تحقیقاتی خود دنبال افراد با مدرک کارشناسی ارشد یا دکترا می گردد که در زمینه های زیر بتوانند به مدت 3-6 ماه در آزمایشگاه تحقیقاتی دیزنی کار کنند. اعلام شده که صدور ویزا نیز برای این شرکت مشکلی ندارد.
برای کسب اطلاعات بیشتر به این سایت تحقیقات دیزنی مراجعه کنید.

این گروه همچنین در همه زمینه های اعلام شده امکان پذیرش افراد با تحقیقات مرتبط را دارد. زمینه مرتبط با کار من یادگیری ماشین و داده کاوی است که خوشبختانه در لیست قرار دارد.

جمعه، بهمن ۰۹، ۱۳۸۸

Job MultiMedia and Multimodal resources, Netherland

مکان : هلند، اروپا
محدودیت زمانی : شما می توانید مدارک خواسته شده را تا 15 فوریه 2010 ارسال کنید. 
مدارک مورد نیاز : فوق لیسانس با 4 سال تجربه مرتبط یا دکترا در زمینه کامپیوتر زا زبانشناسی
حقوق : 53000 یورو سالیانه ( مالیات کسر خواهد شد ) 

حتما لیست مدارک خواسته شده را نگاه کنید. 




PhD Language Technology , Netherland


این بورس برای مدت 3 سال است و تا تاریخ 28 فوریه 2010 مدارک متقاضیان را دریافت میکند.
شروع دوره : بهار یا تابستان 2010

این بورس برای خانمها اولیت قائل است.

Two ESR vacancies at MPI

بورسیه در دورهای فوق لیسانس و دکترا در اروپا

دانشگاههای اروپائی مدتیست که در زمینه کامپیوتر و زبانشناسی بورسیه های خوبی را ارائه می دهند. با توجه به اینکه سایت انگلیسی زبانشناسی کامپیوتری که قبلا داشتم از دسترس خارج شده، بعد از این در مورد بورس دکترا و فوق لیسانس در اروپا در اینجام خواهم نوشت.


برای تمام بورسیه ها یا شغل هائی که در اینجا لیست خواهند شد، محدودیت از نظر صادر کردن ویزای کار یا تحصیل بر اساس ملیت وجود ندارد. با داشتن شرایط لیست شده می توانید برای هر کدام اقدام کنید.

پنجشنبه، بهمن ۰۸، ۱۳۸۸

Statistical Machine Translation

کتابی در مورد ترجمه ماشینی آماری
بالاخره یکی از فعالترین افراد در زمینه ترجمه ماشینی، کتابی اختصاصی را در این زمینه ارائه کرد. شاید این کتاب بتواند بعنوان یک کتاب درسی در تمام دانشگاهها بخصوص دانشگاههای ایران تدریس شود. در این کتاب مباحث زیر ارائه شده است :

بخش اول
  • فصل اول : مقدمه
  • فصل دوم : کلمه، جمله و پیکره
  • فصل سوم : تئوری احتمالات
بخش دوم
  • فصل چهارم : مدلهای مبتنی بر کلمه
  • فصل پنجم : مدلهای مبتنی بر عبارت
  • فصل ششم : دیوکودینگ (جستجوی ترجمه مناسب ) 
  • فصل هفتم : مدل زبان
  • فصل هشتم : ارزیابی
بخش سوم
  • آموزش مبتنی بر تبعیض (Descriminative training )
  • ادغام اطلاعات زبانشناسی
  • مدل مبتنی بر درخت
وب سایت نویسنده کتاب فلیپ کوهن
وب سایت پروژه یورو ماترکیس بعنوان بزرگترین پروژه ترجمه ماشینی اروپا. این پروژه با هدف ارائه یک سیستم ترجمه ماشینی برای ترجمه بین تمام زبانهای اروپائی شروع شده است. فاز اول این پروژه از سپتامبر 2006 شروع شد و در فوریه 2009 به اتمام رسید. فاز دوم این پروژه هم از سال 2009 شروع شده و تا سال 2012 ادامه خواهد داشت.

سه‌شنبه، بهمن ۰۶، ۱۳۸۸

تقاضا برای ترجمه ماشینی همچنان افزایش می یابد



یکی از شرکتهای فعال در زمینه بومی سازی ، اعلام کرده است که بر اساس تحقیقاتی که انجام داده اند، تعداد پاسخ دهندگان به پرسشنامه در قبال سوال استفاده از ترجمه ماشینی به رقمی حدود 58 درصد رسیده است. این رقم برای سال گذشته 40 درصد بوده است.
واقعیت اینست که با گسترش اینترنت و حجم مطالب آنلاین، نیاز به ترجمه خودکار روز از روز بیشتر میشود. برای همین هست که رئیس جمهور آمریکا اعلام می کند که بایستی یک سیستم ترجمه ماشینی با کیفیت داشته باشند. یا اینکه اتحادیه اروپا یکی از بزرگترین پروژه های ترجمه ماشینی را با رقمی بیشتر از دو میلیون یورو شروع کرده است.