دادگان درختی سازه‌ای

تعداد بازدید:۴۲۵

دریافت دادگان درختی سازه‌ای

معرفی: 

دادگان درختی سازه‌ای فارسی دادگانی است که در چارچوب دستور ساخت سازه‌ای هسته‌بنیان (HPSG) تهیه شده‌است این مجموعه داده شامل بیش از ۱۰۰۰ جملهٔ برچسب‌خورده به‌همراه اطلاعات نحوی و برچسب رابطه سازه‌ای مشخص وابسته به هسته است. ازجمله ویژگی‌های دستور ساخت سازه‌ای هسته‌بنیان این است که علاوه بر ارائهٔ توصیف ساختاری سلسله مراتبی سازه‌ها، دانش واژگانی مورد استفاده قرار گرفته و روابط بین واژه‌های در یک سازه به طور واضح و صریح مشخص می‌گردد. این دادگان در قالب ساختار XML تهیه شده‌است.

اطلاعات ارجاع
سایر مستندات: 
  • قیومی، م. (۱۳۹۲). معرفی دادگان درختی و تجزیه‌گر خودکار فارسی. ارائه شده در هشتمین همایش زبان‌شناسی ایران، تهران، دانشگاه علامه‌طباطبایی.
  • Ghayoomi, M.‎, (2012)‎.‎ Bootstrapping the Development of an HPSG-​based Treebank for Persian.‎ In Linguistic Issues in Language Technology, 7 (1)‎, 1-13.
  • Ghayoomi, M.‎ (2012)‎.‎ From Grammar Rule Extraction to Treebanking: A Bootstrapping Approach.‎ In Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), 1912-1919, Istanbul, Turkey.‎
  • Ghayoomi, M.‎ (2012)‎.‎ Word clustering for Persian statistical parsing.‎ In Advances in Natural Language Processing, 126-​137.
  • Ghayoomi, M.‎, and Moradiannasab, O.‎ (2012)‎.‎ The effect of treebank annotation granularity on parsing: A comparative study.‎ In Proceedings of the 11th International Workshop on Treebanks and Linguistic Theories ,109-114, Lisbon, Portugal.‎

 

اطلاعات انتشار داده:

تهیه کننده

مسعود قیومی

مجوز

GNU Lesser General Public License For Linguistic Resources

اجازه انتشار کاربر این داده حق تغییر و انتشار را ندارد و فقط مجاز به استفاده از داده با اهداف پژوهشی غیرتجاری و غیرنظامی است.
تاریخ ثبت 1400-08-03
آخرین تغییر 1400-12-25
آخرین ویرایش۲۵ اسفند ۱۴۰۰