چهارشنبه، فروردین ۲۵، ۱۳۹۵

آیا پایگاه اسناد و مدارک علمی می‌تونه موفق باشه؟


با پایگاه اسناد و مدارک علمی امروز از طریق ایمیل آشنا شدم. در صفحه اول سایت (عکس بالا) نوشته شده بود که ۶۶ درصد محتوای سایت رایگان هست. با توجه به زمینه کاری در مورد ترجمه ماشینی در سایت پایگاه اسناد و مدارک علمی جستجو کردم. حداقل در مورد جستجوی ترجمه ماشینی و در بین ۱۰ نتیجه اول ۸۰ درصد اون پولی بود و تنها ۲۰ درصد رایگان بود. 


تصور می‌کنم که اطلاعات آماری ارائه شده در سایت بصورت کلی درست هست اما احتمالا نسبت ۸۰/۲۰ در مورد بیشتر مطالب مهم بیشتر صدق می‌کنه.

پنجشنبه، آذر ۲۷، ۱۳۹۳

TF-IDF


امروز به مطلبی در مورد پیدا کردن کلمه‌های با اهمیت در یک پیکره برخورد کردم که خیلی ساده دلیل استفاده از TF-IDF را توضیح داده بود. اینکه TF   می‌تونه کمک کنه که واژه‌های مهم در سطح یک document را پیدا کنیم و IDF هم به ما نشون میده که از بین همه این کلمه‌های پرتکرار کدامیک مهمتر هستند.