رشد سریع دادههای حجیم در حوزه بیومدیکال، با حجم بیپایان سوابق سلامت الکترونیکی و بیش از ۳۰ میلیون ارجاع و چکیده در PubMed، نیاز به ساختاردهی خودکار دادههای متنی بیومدیکال را مطرح میکند. در این مقاله، ما روشی برای شناسایی روابط بین موجودیتهای غذایی و بیماریها از متن خام توسعه میدهیم.
به دلیل کمبود دادههای حاشیهنویسیشده در حوزه غذا در رابطه با سلامت، امکانسنجی یادگیری انتقالی را با آموزش مدلهای مبتنی بر BERT بر روی مجموعه دادههای موجود که برای حضور روابط علت و درمان بین انواع مختلف موجودیتهای بیومدیکال حاشیهنویسی شدهاند، بررسی میکنیم و از آنها برای شناسایی همان روابط بین موجودیتهای غذایی و بیماریها در یک مجموعه داده ایجاد شده برای اهداف این مطالعه استفاده میکنیم. بهترین مدلها به مقادیر F1 متوسط ماکرو به ترتیب ۰.۸۴۷ و ۰.۹۰۰ برای روابط علت و درمان دست مییابند.
The accelerating growth of big data in the biomedical domain, with an endless amount of electronic health records and more than 30 million citations and abstracts in PubMed, introduces the need for automatic structuring of textual biomedical data. In this paper, we develop a method for detecting relations between food and disease entities from raw text.
Due to the lack of annotated data on food with respect to health, we explore the feasibility of transfer learning by training BERT-based models on existing datasets annotated for the presence of cause and treat relations among different types of biomedical entities, and using them to recognize the same relations between food and disease entities in a dataset created for the purposes of this study. The best models achieve macro averaged F1 scores of 0.847 and 0.900 for the cause and treat relations, respectively
- Authors: G. Cenikj, T. Eftimov, B.K. Seljak
- URL: https://aclanthology.org/2021.bionlp-1.4.pdf
- DOI URL: https://doi.org/10.18653/v1/2021.bionlp-1.4
- عنوان مقاله: درمانی
- محور مقاله: تکنیک نوین
- افیلیشن نویسنده مسئول: Jožef Stefan International Postgraduate School Ljubljana, Slovenia Computer Systems Department Jožef Stefan Institute Ljubljana, Slovenia
- ایمیل نویسنده فقط برای کاربران ورود / عضویت
- سال انتشار مقاله: 2021
- زبان: انگلیسی
- کشور: اسلواکی
- کد مقاله: 22254
- کلمات کلیدی فارسی: یادگیری انتقالی، رابطه غذا-بیماری، پردازش زبان طبیعی، زعفران، دادههای زیستپزشکی
- کلمات کلیدی انگلیسی: Transfer learning, Food-disease relation, Natural language processing, Saffron, Biomedical data
- لینک کوتاه: https://wikisaffron.org?p=22254
