نویسنده

نویسنده در تلاش است که بهترین محتواهای یونیک و ترجمه را ارائه دهد.

نویسنده

نویسنده در تلاش است که بهترین محتواهای یونیک و ترجمه را ارائه دهد.

  • ۰
  • ۰

در سال های اخیر ، محققان تکنیک های پیشرفته پردازش زبان طبیعی (NLP) را به طور فزاینده ای توسعه داده اند که می توانند برای پردازش ، تفسیر و پاسخ دادن به جملات به زبانهای انسانی آموزش ببینند. علاوه بر این ، برخی از آنها ابزارهایی را ایجاد کرده اند که می توانند محققانی را که در حال توسعه ، آموزش و ارزیابی تکنیک های NLP هستند راهنمایی کنند.


محققان دانشگاه کرنل اخیراً یک ابزار جدید با نام ConvoKit را جمع آوری کرده اند که شامل ابزارها ، روش ها و داده های موجود است که برای تهیه و آموزش مدل های NLP که برای تجزیه و تحلیل مکالمات انسانی و تعاملات اجتماعی ایده آل هستند ، ایده آل است. این مجموعه ابزار جدید ، که در مقاله ای ارائه شده است که در کنفرانس SIGDIAL ماه آینده ارائه می شود ، انواع تکنیک های برش را با استفاده از سطوح مختلف فنی فنی در دسترس کاربران قرار می دهد.

Caleb Chiam ، یکی از محققانی که این ابزار را تولید کرده است ، به TechXplore گفت: "از طریق مکالمات ، بحث می کنیم ، همکاری می کنیم ، همدلی می کنیم و صدایمان را می شنویم." "ابزارهای موجود NLP موجود ، به گونه‌ای طراحی نشده اند که بطور مستقیم با ساختارهای مکالمه کار کنند. ConvoKit این شکاف را پر می کند ، زیرا برای ایجاد ابزارهای محاسباتی برای تجزیه و تحلیل مکالمه در دسترس کاربران است. مهم نیست که پیشینه فنی آنها باشد."

ConvoKit داده های مکالمه را با یک قالب ساده و کاربر پسند ارائه می دهد. این قالب اصلی به توسعه دهندگان متخصص و غیر متخصص اجازه می دهد داده ها را کشف و حاشیه نویسی کنند ، همچنین محاسبات را روی آن اجرا کنند.

چیم توضیح داد: "هر مکالمه مربوط به گروهی از افراد است که با یکدیگر صحبت می کنند و به ترتیب خاصی چیزهای خاصی را می گویند." "ما ممکن است آن گفتگوها را به صورت رونوشت ضبط کنیم. مثلاً به نسخه هایی که در هر قسمت" دوستان "یا هر جلسه دادگاه عالی (هر دو مورد در قالب ConvoKit موجود است ، در بسیاری موارد دیگر فکر می کنیم). ConvoKit مجموعه ای از گفتگوها را به عنوان "جسد" نشان می دهد. "

در ConvoKit ، هر گروه مکالمه دارای سه عنصر یا مؤلفه اصلی است ، یعنی بلندگوها (یعنی چه کسی صحبت می کند) ، مکالمات (یعنی مبادله کلی بین دو یا چند بلندگو) و گفتارها (یعنی آنچه گفته شده توسط یک بلندگو در موارد مختلف در طول مکالمه نکات). این سه عنصر "اشیاء درجه یک" در نظر گرفته می شوند ، به این معنی که ابزار ابزار استفاده آنها را به عنوان واحدهای اصلی تجزیه و تحلیل امکان پذیر می کند.


 
به عنوان مثال ، یک کاربر می تواند از ConvoKit برای پیش بینی اینکه کدام بلندگوها احتمالاً تقلید از سبک زبانی سایر بلندگوها را دارند ، استفاده کند ، چه گفتگوهایی براساس چگونگی شروع آنها ، "سمی" می شوند ، یا اینکه کدام گفتارها مودب هستند و کدام یک از آنها. بی ادب هستند این امر برای انجام تجزیه و تحلیلهایی که بر جنبه های خاص گفتگوها تمرکز دارند ، ایده آل می شود.

چیم گفت: "ساختار ConvoKit کاوش مکالمات را آسان می کند." "به عنوان مثال ، با استفاده از این ساختارهای داده ، انتخاب هر بلندگو در دیتابیس ساده و گفتگوهای انجام شده توسط آن بلندگو و مکالمات شروع شده آسان است. به همین ترتیب ، شما می توانید هر مکالمه را در مجموعه داده انتخاب کنید و از طریق گفتارها تکرار کنید. که مکالمه یا بلندگوهایی را درگیر می کنند. "

جعبه ابزار جدیدی که توسط Chiam و همکارانش تهیه شده است ، ترانسفورماتورهای متنوعی نیز درون آن ساخته شده است که تجزیه و تحلیل های عمیق تری را امکان پذیر می کند. ترانسفورماتورها ماژول هایی هستند که به راحتی می توانند بر روی یک کالبد مکالمه ای اجرا شوند و آنها را با استفاده از روش های پیشرفته یادگیری ماشین و روشهای NLP تجزیه و تحلیل کنند.

چیم گفت: "این روش های محاسباتی را می توان برای هر نوع گفتگوی مکالمه سازگار و استفاده کرد." "علاوه بر این ، کاربران ConvoKit می توانند ترانسفورماتورهای خود را برای آنالیز دلخواه خود طراحی کنند. می توان نمونه هایی از ویژگی های ترانسفورماتور سفارشی شده را که در convokit.cornell.edu ذکر شده است ، پیدا کرد . این موارد شامل مواردی مانند هماهنگی زبانی ، استراتژی ادب ، انواع سریع و موارد دیگر می شود."

این ابزار جدید می تواند برای توسعه دهندگان و علاقه مندان به فناوری غیر متخصص که سعی در ایجاد ابزارهایی برای تجزیه و تحلیل خودکار مکالمات دارند ، بسیار ارزشمند باشد. ConvoKit برای استفاده بسیار آسان و بسیار قابل تنظیم است و این باعث می شود تا برای انواع مختلف برنامه های NLP ایده آل باشد.

  • ۹۹/۰۳/۲۳
  • writer writer

نظرات (۰)

هیچ نظری هنوز ثبت نشده است

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی