جستجوی معنایی زمانی اتفاق می افتد که موتور جستجو با درک قصد و هدف فردی که جستجو را انجام داده و همچنین در نظر گرفتن معنای زمینه ای (context) کلمات مورد جستجو، نتایج بهتری را برای فرد ارائه می دهد. در مقابل جستجوی معنایی، جستجوی مبتنی بر کلمات کلیدی است. در این روش کلمات کلیدی با کلمات موجود در اسناد مقایسه می شود و اسنادی که دارای آن کلمه باشند به عنوان نتیجه برای فرد نشان داده می شوند.
یکی از نمونه های بسیار خوب جستجو بر اساس معنی، موتور جستجوی گوگل است. هدف گوگل از این کار اسپم کمتر، فهم عمیق تر مقصود کاربر و جستجو بر اساس زبان محاوره ای انسان است که در نتیجه ی آن تجربه ی کاربر (user experience) در هنگام جستجو نیز بهبود می یابد.
از طریق تطبیق معنایی، مترادف ها و الگوریتم های زبان طبیعی، جستجوی معنایی نتایج بهتری را با تبدیل داده های ساختار یافته و بدون ساختار به یک پایگاهداده حدسی و پاسخگو فراهم میکند.
مثال زیر را در نظر بگیرید: فردی کلمه ی کلیدی فوتبال را در یک موتور جستجو وارد می کند. موتوری که جستجوی خود را بر اساس کلمات کلیدی انجام می دهد، صفحاتی را برای فرد نشان می دهد که دارای کلمه ی مورد جستجو است. وقتی جستجو بر اساس کلمات کلیدی باشد، ممکن است نتایجی برای شما نشان داده شود که هیچ ارتباطی با مقصود شما نداشته باشد.
اگر این فرد کلمه های کلیدی خود را در موتور جستجوی دیگری وارد کند که مبتنی بر معنا است، نتایج بهتری را پیدا می کند. کلمه ی کلیدی به همراه فاکتورهای دیگر در نظر گرفته می شوند تا نتایج بهتری تولید کنند. در این حالت، ارتباط کلمه ی فوتبال به کلماتی مانند استادیوم، نتایج و اخبار پیدا می شود. این کلمات، محبوب ترین کلماتی هستند که افراد به دنبال آن هستند. بیشتر افرادی که کلمه ی فوتبال را جستجو می کنند به دنبال نتایج هستند در نتیجه، مرتبط ترین کلمه به فوتبال کلمه ی “نتایج” است.
پیاده سازی گوگل برای شرکت ها ممکن نیست ولی می توان موتور جستجویی شبیه گوگل داشت. همه چیز با تعریف یک آنتالوژی شروع می شود. آنتالوژی در واقع نمایش ارتباط معنایی در غالب گراف است. مثلا در یک آنتالوژی ارتباطی بین کلمات “درآمد ” و “مالی” وجود دارد و می توان نتیجه گرفت که “درآمد” یک اصطلاح مالی است.
روش های زیادی برای ایجاد یک آنتالوژی وجود دارد ولی یکی از معروف ترین آن ها w3C است. دشوارترین مرحله ی ایجاد یک جستجوی معنایی ایجاد یک آنتالوژی است. آنتالوژی های متفاوتی به صورت رایگان برای این کار وجود دارند. با توجه به کاربرد خود می توانید از هر یک از آن ها استفاده کنید.
گام بعدی ایجاد یک برنامه است که اسناد فهرست شده در آنتالوژی را تحلیل می کند. در واقع از روش های مختلف پردازش زبان طبیعی استفاده می شود تا متن را تحلیل کند و آن را با آنتالوژی تطبیق دهد. هر چقدر اصطلاحات به گره ی هدف نزدیک تر باشند یعنی ارتباط بهتر است. آخرین مرحله استفاده از روش های پردازش زبان طبیعی برای پیدا کردن نتایج مورد نظر کاربر است.
آنتالوژی به راحتی می تواند در حافظه قرار بگیرد چون حجم کمی را اشغال می کند. بنابراین جستجو در آنتالوژی با سرعت خوبی انجام می شود.