• ۱۴۰۳ جمعه ۲۸ ارديبهشت
روزنامه در یک نگاه
امکانات
روزنامه در یک نگاه دریافت همه صفحات
تبلیغات
صفحه ویژه

30 شماره آخر

  • شماره 4898 -
  • ۱۴۰۰ شنبه ۲۱ فروردين

معاون توسعه مديريت و منابع سازمان اسناد و كتابخانه ملي

هوش مصنوعي فهرست‌نويسي و زمان تدوين آن را ديگرگون كرد

«با حجم انبوهي از منابع در سازمان اسناد و كتابخانه ملي مواجه شديم كه ديجيتال نشده بودند و روزانه بر اين حجم افزوده مي‌شد. براي ما يك دوراهي پديد آمد كه تصميم بگيريم در برابر اين سيل داده‌ها و منابع منفعل عمل كنيم و به نوعي از ميدان سرويس‌هاي ديجيتال به پژوهشگران بيرون بمانيم و تبديل به يك كنشگر بسيار ضعيف شويم.» اين وصف دكتر مظفر پاسدار شيرازي، معاون توسعه مديريت و منابع سازمان اسناد و كتابخانه ملي است. از آنجا كه اين نهاد چندي پيش مركز نوآوري و توسعه كسب‌وكارهاي داده‌محور را افتتاح و طي آن چالشي مطرح كرده كه از تيم‌ها و مجموعه‌هاي استارت‌آپي دعوت كرد تا در قالب رويدادي در اين حوزه باهم رقابت كنند گفت‌وگويي با اين مقام انجام داده‌ايم. او در اين گفت‌وگو تشريح كرده است كه چگونه فهرست‌نويسي در اين نهاد متحول شده است. پاسدارشيرازي مثالي مي‌آورد و مي‌گويد: «كاري را كه هشت سال به طول مي‌انجاميد تا براي مخاطب فهرست شود، توانستيم با زيرساخت پردازشي‌مان و توسط اين سامانه در يك ماه فهرست كنيم.» آنچه پيش رو داريد پرداختن به دوراهي‌ است كه پيش روي سازمان اسناد و كتابخانه ملي قرار داشته و تصميمي كه منجر به استفاده از فناوري در اين نهاد شده است.


 

اينكه كتابخانه ملي به اين سمت برود كه حالا چالشي در حوزه هوش مصنوعي پيش روي فعالان اين حوزه بگذارد، از كجا آغاز شد؟ ورود شما به مساله فناوري و نوآوري چگونه بوده است؟

اولين جرقه‌هاي توجه بيشتر و جدي‌تر به فناوري براي كتابخانه ملي زماني زده شد كه ما با حجم انبوهي از منابع در سازمان مواجه شديم كه ديجيتال نشده بودند و روزانه بر اين حجم افزوده مي‌شد. براي ما يك دوراهي پديد آمد كه تصميم بگيريم در برابر اين سيل داده‌ها و منابع منفعل عمل كنيم و به نوعي از ميدان سرويس‌هاي ديجيتال به پژوهشگران بيرون بمانيم و تبديل به يك كنشگر بسيار ضعيف شويم يا با يك اقدام فعالانه بتوانيم سرويس‌هاي مناسب‌تر و بهتري را حداقل در گوشه‌اي از اين ميدان ارايه كنيم. ايده ما براي در مركز ميدان منابع و پژوهش‌هاي ملي قرار گرفتن، استفاده از فناوري بود. پس از اين، مساله ما، مساله فهرست‌نويسي در اين حجم بالا بود. در فرآيند فهرست‌نويسي، ما طبق محتوا و جزييات كتاب، اطلاعات آن را به گونه‌اي ثبت مي‌كنيم كه قابل جست‌وجو و بازيابي در سامانه باشد. اگر اين حجم گسترده‌اي كه به سازمان رسيده بود با رويكرد‌هاي گذشته توسط همكاران‌مان فهرست‌نويسي مي‌شد، طبق برآورد ما، تقريبا 8 سال به طول مي‌انجاميد اما به دنبال راهي رفتيم كه بشود مقاله را ساده‌تر و بدون درگير كردن همكاران بيشتر فهرست‌بندي كرد و توانستيم با كمك چند مجموعه به سمت استخراج خودكار فراداده منبع برويم و در نهايت در سال 98 توانستيم سامانه‌اي را توسط يكي از شركت‌هاي دانش‌بنيان طراحي كنيم كه با سرعت بسيار بالايي فراداده مقاله را استخراج و در استاندارد مارك ايران مستقر كند و در اختيار مخاطب قرار دهد. در سال 99 توانستيم اين سامانه را براي كتاب نيز توسعه دهيم. اين بدان معناست كاري را كه هشت سال به طول مي‌انجاميد تا براي مخاطب فهرست شود، توانستيم با زيرساخت پردازشي‌مان و توسط اين سامانه در يك ماه فهرست كنيم. از اين دست مثال‌ها بسيارند كه فناوري مي‌تواند به كمك سازمان اسناد و كتابخانه ملي بيايد و فرآيند‌ها را تسهيل و تسريع كند و زمينه‌اي باشد كه بتوان سرويس‌هاي بهتري را براي مخاطب ارايه كنيم. حتي شايد لازم نباشد كتابخانه مستقيما اين سرويس را در اختيار مخاطب قرار دهد بلكه كسب‌وكار‌هاي نو پا به عرصه ورود كنند و اين سرويس‌ها را توسعه دهند و بازار مخاطبان خود را نيز پيدا كنند. ما در صدد توسعه اين سامانه هستيم تا با بهره‌گيري از يادگيري عميق بتوانيم خروجي استخراج فراداده پايان‌نامه را نيز در اختيار مخاطب قرار دهيم و از آن رونمايي كنيم. سال گذشته سامانه ايران ژورنال رونمايي شد و تقريبا اغلب مقالات فارسي علمي در اين سامانه با امكان جست‌وجوي مناسب و استاندارد در اختيار مخاطبان قرار گرفته است. امسال و در يك ماه آينده هم در مورد پايان‌نامه اين اتفاق رقم خواهد خورد، به اين معني كه در فاصله بسيار كوتاهي پس از بارگزاري پايان‌نامه در سامانه، فراداده آن استخراج مي‌شود.

اين امكان در خصوص كتاب هم وجود دارد؟

مساله كتاب كمي متفاوت است، در خصوص مقاله و كتاب، كليدواژه توسط نويسنده و سپس توسط داوران انتخاب و تاييد شده است و اين در جست‌وجو و بازيابي اطلاعات كمك خواهد كرد اما در مورد كتاب اين‌طور نيست. متخصصين علم اطلاعات و دانش‌شناسي در كتابخانه ملي، يا هر كتابخانه ديگري، پس از استخراج اطلاعات توصيفي كتاب، اطلاعات تحليلي آن را نيز استخراج مي‌كنند يعني تعدادي موضوع براي كتاب تعريف مي‌كنند. اين موضوعات به پژوهشگر كه از سيستم جست‌وجوي كتابخانه استفاده مي‌كند كمك خواهد كرد تا منبع مورد نظر را پيدا كند. پس هر چقدر برچسب‌هاي موضوعي دقيق‌تر و با جزييات بيشتري باشند و موتور جست‌وجو بتواند نظامات معنايي و اصطلاح‌نامه‌اي را بهتر تكميل كند، به پژوهشگر در بازيابي اطلاعات كمك بيشتري مي‌كند.

اينجا نياز ما براي استفاده از هوش مصنوعي براي تسريع و تدقيق اين فرآيند خود را نشان داد يعني ما به اين نتيجه رسيديم كه اگر در كنار فهرست‌نويس ما سامانه‌اي هوشمند قرار گيرد و به او برچسب‌هاي موضوعي را براساس تحليل ماشين پيشنهاد دهد، فرد متخصص مي‌تواند با سرعت و دقت بيشتري كار را پيش ببرد. ما توانستيم اين جريان را به يك رويداد تبديل كنيم كه با كمك متخصصين هوش مصنوعي به راهكاري مناسب دست پيدا كنيم.

دارايي كتابخانه ملي يعني داده‌ها، اطلاعات و منابع، به‌طور بالقوه مي‌تواند ارزش زيادي داشته باشد. آيا براي كتابخانه ملي، ورود به عرصه نوآوري همراه با ورود به عرصه اقتصاد است؟

نه از اين منظر كه كتابخانه ملي بخواهد در اقتصاد نقشي ايفا كند اما مي‌تواند در واقع در بيرون از آب كشيدن اين گليم كمكي كند. در اواخر سال 97 با همكاري سازمان فناوري اطلاعات و سازمان نوآوري و شكوفايي تلاش ما بر اين بود كه براي خدمت گرفتن بستري را فراهم سازيم و براي ايجاد اين بستر يك برنامه نوآوري در سازمان ايجاد كرديم. براي اجراي اين برنامه نوآوري، مركز نوآوري و توسعه كسب‌وكارهاي داده‌محور راه‌اندازي شد و تلاش بر اين بود كه بخش‌هاي مختلف فعال در اين اكوسيستم به ياري طلبيده شوند: از شتاب‌دهنده‌هاي بخش خصوصي، كنشگران دولتي و سياست‌گذاران، خود استارت‌آپ‌ها و... قدم بعدي برگزاري رويداد ويتا در تابستان سال 98 بوده است كه در آن رويداد توانستيم بخش قابل توجهي از چالش‌هايي كه كتابخانه ملي با آن مواجه بوده است را برجسته كنيم و از گروه‌هاي استارت‌آپي دعوت كنيم كه كمك كنند راه‌حل‌هاي خلاقانه‌اي براي برون‌رفت از اين چالش‌ها داشته باشيم. در همين بين به تدريج گروه‌هاي پذيرفته‌شده با ما وارد همكاري شدند و در خلال آن، توجه ما بيش از پيش به وظيفه سازمان اسناد و كتابخانه ملي در قبال خط و زبان فارسي و لزوم تعامل كسب‌وكار‌هاي حوزه هوش مصنوعي جلب شد.

اگر تا قبل از اين فقط از استارت‌آپ‌ها كمك مي‌گرفتيم، بعد به اين موضوع پي برديم كه در حوزه هوش مصنوعي نيز بايد خدمات جديدي ايجاد و در اختيار مخاطب قرار دهيم. وظيفه‌اي كه براي خودمان تعريف كرديم هموار كردن راه دسترسي اكوسيستم نوآوري به داده‌ها براي توسعه سامانه‌هاي هوشمند بود.

قصد ما اين است اين خدمات را مانند خدمات كتابخانه‌اي در اختيار آحاد مردم قرار دهيم و تلاش‌مان اين است كه در ساير حوزه‌ها نيز اين اطلاعات را گسترش دهيم. بعضي مواقع شرايط ايجاب مي‌كرده كه با نظارت مراجع ذي‌صلاح مزايده‌اي برگزار شود و مشكلات را برطرف كنيم اما مركز نوآوري ما وظيفه خود مي‌داند كه هر شركت يا استارت‌آپي كه بتواند وارد اين حوزه شود را حمايت كند. حتي اگر نتواند امكانات قابل توجهي به او بدهد، دست كم خدمات مشاوره‌اي در اختيارش مي‌گذارد يا اگر بتواند محل استقرارش را تامين مي‌كند و به هر نحوي بتواند كمك مي‌كند مجموعه‎ها رشد پيدا كنند و خدمتي ارايه دهند.

چه نقشي براي رويدادهايي مثل ليبتك 2 در نظر گرفته‌ايد؟

ما پيش از رويداد ليبتك 2، رويداد ويتا را برگزار كرديم. در آن رويداد معترفيم كه خود سازمان اسناد و كتابخانه ملي در حال كسب تجربه و يادگيري بود. طبيعتا ضعف‌هايي در اين مسير وجود داشت كه با بازنگري در برخي روندها در پي اصلاح هستيم. مي‌دانيم اگر سازمان اسناد و كتابخانه ملي اگر در يك عرصه‌اي وارد مي‌شود بايد تمام الزامات در نظر گرفته شود و همين امر باعث شد رويداد دوم بسيار تكميل‌تر ارايه شود و در اين رويداد اگر ما وارد شديم دادگان را قبل از برگزاري رويداد آماده كرديم و شايد بتوان گفت براي اولين بار، مجموعه دادگان خيلي خوبي را فراهم آورده‌‌ايم. ما زيرساخت‌هاي پردازشي را نيز با كمك يكي از شتاب‌دهنده‌ها براي مجموعه آماده كرده‌ايم. سعي بر اين بوده كه تمام ابزارهاي چالش را فراهم كنيم و در اختيار قرار دهيم و در نهايت نيز علاوه اعطاي جايزه مسابقه به برنده، امتياز دوم عقد قرارداد گروه پيروز چالش با سازمان اسناد و كتابخانه ملي است.

مركز نوآوري‌اي كه توسط كتابخانه ملي تاسيس شده چه برنامه‌ريزي‌اي براي تبديل نشدن به يكي از مراكز نوآوري كم‌اثر دولتي دارد؟

ما قبول داريم كه دولت به چابكي و توانمندي بخش خصوصي در اين عرصه نيست. به همين دليل ما تمام تلاش‌مان بر اين است كه هرچه بيشتر بخش خصوصي و فعالان خصوصي اين عرصه را به كمك بطلبيم. يكي از مهم‌ترين مشخصه‌هاي برنامه نوآوري‌اي كه به عنوان سند پشتيبان طراحي شده اين است كه اگر عرصه‌اي باشد كه بخش خصوصي در آن فعال است دولت ديگر با بخش خصوصي رقابت نكند و عرصه را باز بگذارد و از بخش خصوصي كمك بگيرد. به همين دليل ما هيچگاه قصد نداشته‌ايم كه شتاب‌دهنده‌اي راه بيندازيم؛ هرچند كه در اين حوزه شتاب‌دهنده بسيار كم و انگشت‌شمار است.

ما نقش خود در تامين بيگ ديتا (كلان داده‌ها) را سعي كرده‌ايم مسوولانه ايفا كنيم و در ادامه تعامل بيشتري با بيرون از دولت داشته باشيم. پس سعي ما بر اين است به جاي رقابت مشاركت كنيم.

براي مركز چه چشم‌انداز و چه اولويت‌هايي مدنظر قرار داده‌ايد؟

مركز براي ارايه خدمات مختلف به گروه‌هاي استارت‌آپي پديد آمده است. اولين نياز يك تيم، نياز به محل استقرار است كه از طريق يك فضاي كار اشتراكي براي مجموعه با مشاركت بخش خصوصي ايجاد شده است و در حال توسعه آن هستيم تامين مي‌شود. براي آموزش‌هايي در اين عرصه، چه آموزش‌هاي عمومي، چه آموزش تخصصي و چه گفتمان‌سازي برنامه عملياتي طراحي كرده‌ايم. بخشي از ساختمان مركز نوآوري براي توليد محتوا و رويداد‌ها در نظر گرفته شده است كه از مجموعه‌اي ديگر دعوت به همكاري شده تا به ما در اين زمينه كمك كند.

مدل‌هاي همكاري با اين مركز چگونه است؟

طيف نسبتا گسترده‌اي از فعالان اكوسيستم نوآوري مي‌توانند با ما همكاري كنند و هدف ما تعامل براي حل مسائل واقعي سازمان است. از سطح كسب‌وكارهاي تثبيت‌شده گرفته تا تيم‌ها و افراد خلاقي كه در مركز رشد مستقر مي‌كنيم، مشمول اين تعامل‌ها هستند. برخي گروه‌ها هستند كه اساسا كسب‌وكار نيستند اما مي‌توانند در مركز رشد ما مستقر شوند، منتورشيپ تخصصي حوزه مديريت دانش اطلاعات دريافت كنند، زيرساخت پردازشي در اختيارشان قرار گيرد و خدماتي را براي كتابخانه و مخاطبانش توسعه دهند. هدف ما از برگزاري رويدادها هم شناسايي شايسته‌ترين‌ها براي همكاري است و كمك به توسعه ايده‌هاي موثر.

ارسال دیدگاه شما

ورود به حساب کاربری
ایجاد حساب کاربری
عنوان صفحه‌ها
کارتون
کارتون