آخرین مهلت ارسال مقالات برای دوره ۳ -شماره ۸ -پاییز ۱۴۰۲:
(۱۵ آذر ماه ۱۴۰۲)
تولید متن فارسی با استفاده از ویکی پدیا توسط دو رویکرد ParsBERT و GRU
دوره و شماره : قابل انتشار
1 دانشجوی کارشناسی ارشد دانشگاه امام حسین (ع)
2 استادیار دانشگاه امام حسین (ع)
چکیده :
تولید متن یک وظیفه اساسی در پردازش زبان طبیعی است که امکان ایجاد متنی شبیه انسان را برای کاربردهای مختلف فراهم می¬کند. در این مطالعه، دو رویکرد ParsBERT و GRU برای تولید متن فارسی با استفاده از مجموعه داده ویکیپدیا بررسی می¬شود.ParsBERT، یک مدل زبان از پیش آموزش داده شده فارسی، به عنوان ستون فقرات سیستم تولید متن عمل می کند. ParsBERT بر روی مجموعه داده ویکیپدیای فارسی در مقیاس بزرگ تنظیم خواهد شد تا پیچیدگیهای زبان فارسی را بیاموزد و متنی منسجم و متناسب با زمینه تولید کند. علاوه بر این، اثربخشی رویکرد GRU، گونهای از شبکههای عصبی مکرر، در تولید متن فارسی بررسی خواهد شد. مدلهای GRU به دلیل تواناییشان در گرفتن وابستگیهای متوالی و تولید متن بر اساس زمینه قبلی شناخته شدهاند. برای ارزیابی کیفیت متن تولید شده، از چند ارزیاب انسانی خواسته شد که از معیارهای کمی و کیفی جهت ارزیابی انسجام، روان بودن و ارتباط متن استفاده کنند. نتایج اولیه نشان میدهد که هر دو رویکرد ParsBERT و GRU پتانسیل تولید متن فارسی معنادار و آگاه از زمینه را دارند. با این حال، تفاوت¬های ظریفی در کیفیت خروجی بین دو روش مشاهده خواهد شد. در حالی که ParsBERT تمایل دارد متن منسجم و روانتری تولید کند، GRU قدرت خود را در گرفتن وابستگیهای بلندمدت و ایجاد تغییرات خلاقانه نشان میدهد. این مطالعه با بررسی قابلیتهای رویکرد ParsBERT و GRU به پیشرفت تولید متن فارسی کمک میکند. این یافتهها نقاط قوت و محدودیتهای هر روش را روشن میکند و بینشهای ارزشمندی را در زمینه تولید متن فارسی با کیفیت برای کاربردهای مختلف، مانند چتباتها، ایجاد محتوا، و سیستمهای تولید زبان ارائه میدهد.
تولید متن یک وظیفه اساسی در پردازش زبان طبیعی است که امکان ایجاد متنی شبیه انسان را برای کاربردهای مختلف فراهم می¬کند. در این مطالعه، دو رویکرد ParsBERT و GRU برای تولید متن فارسی با استفاده از مجموعه داده ویکیپدیا بررسی می¬شود.ParsBERT، یک مدل زبان از پیش آموزش داده شده فارسی، به عنوان ستون فقرات سیستم تولید متن عمل می کند. ParsBERT بر روی مجموعه داده ویکیپدیای فارسی در مقیاس بزرگ تنظیم خواهد شد تا پیچیدگیهای زبان فارسی را بیاموزد و متنی منسجم و متناسب با زمینه تولید کند. علاوه بر این، اثربخشی رویکرد GRU، گونهای از شبکههای عصبی مکرر، در تولید متن فارسی بررسی خواهد شد. مدلهای GRU به دلیل تواناییشان در گرفتن وابستگیهای متوالی و تولید متن بر اساس زمینه قبلی شناخته شدهاند. برای ارزیابی کیفیت متن تولید شده، از چند ارزیاب انسانی خواسته شد که از معیارهای کمی و کیفی جهت ارزیابی انسجام، روان بودن و ارتباط متن استفاده کنند. نتایج اولیه نشان میدهد که هر دو رویکرد ParsBERT و GRU پتانسیل تولید متن فارسی معنادار و آگاه از زمینه را دارند. با این حال، تفاوت¬های ظریفی در کیفیت خروجی بین دو روش مشاهده خواهد شد. در حالی که ParsBERT تمایل دارد متن منسجم و روانتری تولید کند، GRU قدرت خود را در گرفتن وابستگیهای بلندمدت و ایجاد تغییرات خلاقانه نشان میدهد. این مطالعه با بررسی قابلیتهای رویکرد ParsBERT و GRU به پیشرفت تولید متن فارسی کمک میکند. این یافتهها نقاط قوت و محدودیتهای هر روش را روشن میکند و بینشهای ارزشمندی را در زمینه تولید متن فارسی با کیفیت برای کاربردهای مختلف، مانند چتباتها، ایجاد محتوا، و سیستمهای تولید زبان ارائه میدهد.
کلمات کلیدی :
پردازش زبان طبیعی، تولید متن، ویکی پدیا
پردازش زبان طبیعی، تولید متن، ویکی پدیا