از نوشته های من در سکان آکادمی
مهمترین هدف گوگل همواره سعی در سازماندهی بهتر اطلاعات موجود در وبسایتهای گوناگون بوده است که در دنیای وب وجود دارند و این در حالی است که سرویس Dataset Search در کنار Google Scholar، جامعهٔ علمی را هدف اصلی خود قرار داده است به طوری که این موتور جستجو برای فعالیتهای علمی تحقیقاتی و مطالعات دانشگاهی مورد استفاده قرار میگیرد. به عبارتی، گوگل این موتور جستجوی جدید را برای یافتن دیتاست طراحی کرده است که به دانشمندان کمک میکند دادهٔ مورد نیاز خود را در زمانی سریعتر و با صرف کمترین تلاش پیدا کنند.
Dataset Search نحوهٔ عملکردش بدین ترتیب است که از اطلاعات درج شده در متاتگهای وبسایت مؤسساتی که اطلاعات علمی خود را به صورت آنلاین منتشر میکنند (مثل دانشگاهها یا سازمانهای دولتی) مواردی نظیر تولیدکنندهٔ دیتا، تاریخ انتشار، روش جمعآوری و … را پیدا نموده و پس از ترکیب با Knowledge Graph خود آنها را ایندکسگذاری میکند.
با وجود افزایش چشمگیر حجم دادهها و دیتاستهای علمی موجود در اینترنت به واسطه مواردی نظیر درخواست ژورنالهای علمی از نویسندگان مقالات به منظور اشتراکگذاری دیتاستهای مورد استفاده و تغییر مقررات دولتی آمریکا و اروپا و جنبش عمومی دسترسی مردم به دادهها، یکی از مشکلات حاضر برای دادههای علمی منتشرشده در وب پراکندگیبسیار زیاد آنها است و این مورد باعث شده است تا محققان برای یافتن دیتاستهای مورد نیاز خود، به خصوص در سایر زمینههای تحقیقاتی که اشراف کمتری به آنها دارند، زمان زیادی را از دست بدهند (یکی از ابزارهایی که برای کار با دیتاستها مورد استفاده قرار میگیرد Kaggle است که برای آشنایی بیشتر با آن میتوانید به مقالهٔ Kaggle: کامیونیتی مدیریت پروژههای مرتبط با Data Science مراجعه نمایید.)