Saffron: transfer learning for food-disease relation extraction

زعفران: یادگیری انتقالی برای استخراج رابطه غذا-بیماری

بروزرسانی مهر 27, 1404

ثبت کننده سارا کردستانی

تعداد بازدید 58

رشد سریع داده‌های حجیم در حوزه بیومدیکال، با حجم بی‌پایان سوابق سلامت الکترونیکی و بیش از ۳۰ میلیون ارجاع و چکیده در PubMed، نیاز به ساختاردهی خودکار داده‌های متنی بیومدیکال را مطرح می‌کند. در این مقاله، ما روشی برای شناسایی روابط بین موجودیت‌های غذایی و بیماری‌ها از متن خام توسعه می‌دهیم.

به دلیل کمبود داده‌های حاشیه‌نویسی‌شده در حوزه غذا در رابطه با سلامت، امکان‌سنجی یادگیری انتقالی را با آموزش مدل‌های مبتنی بر BERT بر روی مجموعه داده‌های موجود که برای حضور روابط علت و درمان بین انواع مختلف موجودیت‌های بیومدیکال حاشیه‌نویسی شده‌اند، بررسی می‌کنیم و از آنها برای شناسایی همان روابط بین موجودیت‌های غذایی و بیماری‌ها در یک مجموعه داده ایجاد شده برای اهداف این مطالعه استفاده می‌کنیم. بهترین مدل‌ها به مقادیر F1 متوسط ماکرو به ترتیب ۰.۸۴۷ و ۰.۹۰۰ برای روابط علت و درمان دست می‌یابند.

 

The accelerating growth of big data in the biomedical domain, with an endless amount of electronic health records and more than 30 million citations and abstracts in PubMed, introduces the need for automatic structuring of textual biomedical data. In this paper, we develop a method for detecting relations between food and disease entities from raw text.

Due to the lack of annotated data on food with respect to health, we explore the feasibility of transfer learning by training BERT-based models on existing datasets annotated for the presence of cause and treat relations among different types of biomedical entities, and using them to recognize the same relations between food and disease entities in a dataset created for the purposes of this study. The best models achieve macro averaged F1 scores of 0.847 and 0.900 for the cause and treat relations, respectively

  • عنوان مقاله: درمانی
  • محور مقاله: تکنیک نوین
  • افیلیشن نویسنده مسئول: Jožef Stefan International Postgraduate School Ljubljana, Slovenia Computer Systems Department Jožef Stefan Institute Ljubljana, Slovenia
  • ایمیل نویسنده فقط برای کاربران ورود / عضویت
  • سال انتشار مقاله: 2021
  • زبان: انگلیسی
  • کشور: اسلواکی
  • کد مقاله: 22254
  • کلمات کلیدی فارسی: یادگیری انتقالی، رابطه غذا-بیماری، پردازش زبان طبیعی، زعفران، داده‌های زیست‌پزشکی
  • کلمات کلیدی انگلیسی: Transfer learning, Food-disease relation, Natural language processing, Saffron, Biomedical data
  • لینک کوتاه: https://wikisaffron.org?p=22254

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *