الگوریتم مشابهت متن با استفاده از تکنیک LSH

الگوریتم مشابهت متن با استفاده از تکنیک LSH

محاسبه‌ی فاصله‌ی اجزا یکی از اصلی‌ترین چالش‌های تحلیل کلان داده می‌باشد.

فاصله‌ی دو متن، صدا، تصویر و … از جمله مواردی هستند که نیاز به تعریف معیار و الگوریتم محاسبه‌ی آن دارند.

در این پست سه تکنیک shingling، minhasing و Locality sensitive hashing (LSH) مورد مطالعه قرار گرفته است.

لینک ارائه‌ی اصلی الگوریتم از درس Mining on massive datasets:

اسلاید اصلی

مقاله‌ی فارسی

اسلاید‌های فارسی

اشتراک گذاری پست

دیدگاه (2)

  • سید احمد پاسخ

    سلام.
    پیوند Minhashing هم Finding Similar Sets اشاره دارد.

    تیر ۲۰, ۱۳۹۶ در ۳:۳۵ ق٫ظ
  • حسين پاسخ

    سلام.ممنون از ارائه دقیق مطالب مبحث فوق.
    چطور می توانم مقاله فارسی رو به طور کامل داشته باشم.
    تشکر از زحمات شما.

    آبان ۱۳, ۱۳۹۶ در ۱۰:۳۹ ب٫ظ

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


CLOSE
CLOSE