موضوعات وبسایت : سلامت

گفتار در جدول

گفتار در جدول

نویسنده : نادر | زمان انتشار : 04 مرداد 1398 ساعت 15:52

گفتار

گفتار یا تکلم یکی از فرایندهای ارتباطیِ انسان هاست.

گفتار با به وجود آوردن صدا توسط

دهان

و تا حدودی بینی انسان به وجود می آید. در این فرایند،

دندان ها

،

زبان کوچک

و بزرگ،

حنجره

و بینی نقش دارند. گفتار مهم ترین روش ارتباط انسانی است.

گفتار عبارت است از شکل تلفظ شدهٔ ارتباطات انسانی که مبتنی بر ترکیب

نحوی

لغات و یا نام هایی است که از

فرهنگ لغات

بسیار بزرگ (معمولاً بیش از ۱۰٬۰۰۰ لغت مختلف) بدست می آیند. هر کلمه گفتاری از ترکیب

آوایی

مجموعه محدودی از واحدهای صوتی گفتاری ثابت و صدادار ایجاد می شود. این

فرهنگ لغات

، نحوی که آنها را می سازد، و مجموعه واحدهای صوتی گفتاری آنها، متفاوت با ایجاد موجودیت هزاران نوع مختلف زبان های بشری است که متقابلاً غیرقابل فهم اند.

افراد (متکلّمین به چند زبان) اغلب قادر به برقراری ارتباط با دو یا بیشتر زبان اند. توانایی های صوتی که انسان ها را قادر به تولید گفتار می کند نیز به انسان توانایی آواز خواندن می دهد. فرم اشاره ای ارتباط انسانی برای ناشنوایان به شکل زبان علائمی وجود دارد. گفتار در برخی فرهنگ های زبان مکتوب بوده است، اغلب زبانی که به لحاظ

فرهنگ لغت

، نحویات و آوائی متفاوت از زبان تکلمی همراه بوده است، به دوزبانه (diglossia)، گفتار علاوه بر استفاده اش در ارتباطات، توسط برخی روانشناسان همچون ویگوتسکی اشاره شده که بطور داخلی توسط پروسه های ذهنی استفاده می شود جهت بالابردن و سازمان دادن ادراک به شکل یک گفتار یک نفری با لحن گفتار گفتن برحسب تولید گفتار و ادراک اصوات استفاده شده در زبان تکلمی پژوهش می شود. عناوین پژوهش دیگر، مربوط به

تکرار گفتار

، توانایی برای تبدیل کلام تکلمی شنیده شده به اصوات مورد نیاز برای تولید مجدد که نقش اساسی در توسعه

فرهنگ لغت

در کودکان و خطاهای تکلمی دارد. چندین درس دانشگاهی که این ها را مطالعه می کنند شامل، اصوات شناسی، روانشناسی، آسیب شناسی گفتاری، زبان شناسی،

علوم ادراکی

، مطالعات ارتباطات، رشته بیماری های گوش، گلو و بینی و

علوم کامپیوتر

است. ناحیه پژوهشی دیگر این است که چقدر مغز انسان در سطوح مختلف خود نظیر سطح بروکا و سطح و رینک پایه گفتار هستند. مباحثه ای است که چقدر گفتار انسان منحصر است به لحاظ این که سایر حیوانات دیگر نیز با اصوات ارتباط برقرار می کنند. با وجودی که هیچ کدام در وحوش فرهنگ لغوی بزرگی ندارند، پژوهش روی توانایی های غیرزبانی میمون های زبان آموخته نظیر واشو و کانزی این امکان را افزایش می دهد که آن ها ممکن است این توانایی ها را داشته بوده اند. اصول گفتار ناشناخته اند و موضوع بحش و تفکرهای بسیاری هستند.

کتاب گفتار حکیم درباره مقام علمی غلامحسین ابراهیمی دینانی است که به کوشش محمدجعفر محمدزاده گردآوری شده و انتشارات امرود آن را چاپ نموده است.

گفتار در روش راهبرد عقل (به فرانسوی: Discours de la méthode) اولین متن فلسفی است که توسط رنه دکارت منتشر شده و در ژوئن سال ۱۶۳۷ انتشار یافته است. این کتاب را دکارت مستقیما به زبان فرانسه نوشته است تا با سنت مرسوم کتابت متون علمی به زبان لاتین هم مخالفت کرده باشد.

گفتار راست نام یکی از مطبوعات استان فارس در دوران قاجاریه است.

این روزنامه از سال ۱۳۴۰ هـ.ق به وسیله حسنعلی حکمت در شیراز به چاپ رسیده است.

گفتار فلسفی مدرنیته: دوازده درس گفتار (به آلمانی: Der Philosophische Diskurs der Moderne: Zwölf Vorlesungen) کتابی از یورگن هابرماس است. هابرماس در این کتاب این ادعای پست-مدرنهایی مانند لیوتار، دریدا، فوکو و دیگران مبنی بر این که پروژهٔ مدرنیته به پایان رسیده و عقلِ روشنگری دیگر کارگشا نیست را مورد اعتراض قرار داده و از این نظریه دفاع کرده که ما همچنان در مدرنیته هستیم زیرا مدرنیته پروژه ای بلند-مدت و بی پایان است که همچنان ادامه دارد و اصول آن اگر در جایی هم خدشه برداشته باشد، همچنان قابل دفاع است.

اختلال های آواهای گفتار (به انگلیسی: Speech sound disorder) دسته ای از اختلال های گفتاری هستند که در برخی آواهای گفتار (که به آنها واج گفته می شود) در زبان مادری یک کودک یا گاهی در (بزرگسال) یا تولید نمی شود یا به درتسی تولید نمی شوند و یا به درستی استفاده نمی شود. خطاهایی که توسط کودکان با اختلال گفتار تولید می شوند معمولا به ۴دسته تقسیم می شوند:

حذف:آواهای خاصی تولید نمی شوند همچنین سیلابل ها با طبقه ای از آواها می تواند حذف شوند و برای مثال fiبرای fish یا at برای cat.

علاوه بر این فهمیدن کودکان با اختلال های شدید گفتاری می تواند سخت باشد و این را سخت می کند که بگوییم کدام کلمه در حقیقت مد نظر است بنابراین چه چیز می توند در مورد او اشتباه باشد.

اضافه کردن:یک صدا یا چند صدای اضافه با کلمه مورد نظر جمع می شود.

اختلال آوای گفتار به دو دسته ابتدایی تقسیم می شود: اختلال های گفتاری و اختلال واجی).

تغییر صدا دادن یا شکل یا ظاهر کلمه: صداهایی هستند که می توانند کمی تغییر کنند بنابراین صداهای خاص می تواند اشتباه تشخیص داده شود یا شبیه هر صدایی در زبان نمی تواند باشد بهترین مثال علمی برای تغییر شکل یافتگی lisp است.

در حالی که برخی می تواند ترکیبی از هر دوی گفتار واجی باشد که مشکلات گفتاری و واجی هر دو با هم وجود دارند. در حالی که اختلال های گفتار مربوط به دوران کودکی است برخی از خطاهای باقی مانده می تواند مربوط به دوران نوجوانی باشد.

جایگزینی:یک صدا یا صداهای بیشتری جایگزینی بقیه می شوند برای مثال wabbit برای rabbit و towبرای cow دقت کنید حتی گاهی برای متخصصان هم گفتن دقیق نوع کلمه می تواند دقیق و واضح نباشد. برخی گونه های جایگزینی /r/ می تواند با /w/ اشتباه شود. هنوز تعداد چندانی از هیچ صدایی نیست اگرچه در بینشان است.

اختلال های گفتاری همچنین اختلال های واجی نامیده می شود یا به طور ساده arctic disorders برای مدت کوتاهی بر اساس یادگیری دشوار برای تولید فیزیکی واج ها ی مورد نظر. معمولا خطاهای کمتری با یک اختلال واجی و تغییر شکل بیشتر شبیه هستند وجود دارد. در حالی که همهٔ حذف ها و اضافه شده ها و جایگزینی ها می تواند حاضر باشد آن ها اغلب مربوط به آموزش کودکان که چطور آواها را فیزیکی تولید کنند و در جهت تولید آنها تمرین داشته باشند تا اینکه آن طبیعی گردد اختلال های مصنوعی نباید با اختلال حرکت دهنده یا گفتار اشتباه گرفته شود. به طور تغذیه معیوب (که د حقیقت وضعیت ترتیب ماهیچه های گفتار را از کار می اندازد) یا اختلال های Childhood Apraxia of Speech به چندین خرابی منتهی است.

اختلالات حرکتی گفتار (انگلیسی: Motor speech disorders) گروهی از اختلالات گفتاری هستند که توانایی طبیعی بدن در انجام گفتار را به سبب نارسایی های مغزی-عصبی مختل می کنند. این نارسایی ها، سبب می شود که فرد مبتلا، نتواند بخش های «برنامه ریزی»، «کنترل»، «هماهنگ سازی» و «اجرا» ی تولید گفتار و تکلم را انجام دهد.

سبب شناسی این نارسایی ها بر حسب یک پارچگی و بی نقص بودنِ فعالیت های دستگاه ماهیچه ای اسکلتی انسان، شناختی و عصبی-عضلانی فرد متفاوت است. سخن گفتن و تکلم، عملی است که وابسته به افکار و اجرای به موقعِ حرکان لب، زبان، آرواره و به جریانِ انداخت هوا در این نواحی است. این نارسایی ها می توانند ناشی از ضعف در عضلات دهانی (دیس آرتری) یا ناتوانی در اجرای حرکات ضروری و مختص به تولید صدا (آپراکسی گفتار یا دیس پراکسی کلامی تکاملی) باشند.

هدف از تشخیص گفتار که در متون علمی بیشتر با نام بازشناسی گفتار شناخته شده است، طراحی و پیاده سازی سیستمی است که اطلاعات گفتاری را دریافت و متن و فرمان گوینده را استخراج می کند. فناوری بازشناسی گفتار به رایانه ای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را می دهد که گفتار کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزینی برای صفحه کلید یا ماوس برای وارد کردن دستورات مورد استفاده قرار می گیرد. سیستم های واکافت کننده گفتار انواع مختلفی دارند، بعضی قادرند گفتار پیوسته را شناسایی نمایند، بعضی دیگر فقط می توانند گفتار گسسته (که بین کلمات سکوت وجود دارد) را شناسایی کنند. همچنین سیستم ها قادرند واژگان گفته شده توسط افراد مختلف و یا فقط توسط یک گوینده تشخیص دهند. بهر حال ایده آل ترین سیستم آن است که بتواند گفتار پیوسته غیر وابسته به گوینده را در محیط نویزی شناسایی نماید. این سیستم ها با بکار گیری روش های مختلف طبقه بندی و شناسایی الگو قادرند به تشخیص واژگان هستند که البته برای افزایش دقت در شناسایی از یک فرهنگ لغات نیز در انتهای سیستم استفاده می شود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستم های تشخیص گفتار مورد استفاده قرار می گیرند و در بخش های انتهایی سیستم از هوش مصنوعی کمک گرفته می شود.

یک سیستم بازشناسی گفتار خودکار (Automatic Speech Recognition) که به اختصار ASR نامیده می شود با چالشهای فراوانی روبروست. از جمله مهمترین این چالشها می توان به وجود نویز، انتخاب مجموعه ویژگی های مناسب، انتخاب مدل آکوستیکی مناسب، تنوع زبان، تنوع جنسیت و مشکل لهجه در بازشناسی گفتار اشاره نمود. در مورد زبان های رایج مانند انگلیسی کارهای زیادی در جهت مقابله با این چالش ها انجام شده است اما در مورد زبان فارسی هنوز راه زیادی در پیش است. امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکار گیری نرم افزار تشخیص گفتار می توان دستورات یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشی های تلفن همراه از این سیستم ها جهت دریافت دستورات بصورت صوتی استفاده می شود.

از آنجا که ارتباط کلامی راحت ترین، ساده ترین و سریع ترین راه ارتباطی می باشد با کمک سیستمهای تشخیص گفتار عصر گویش پرداز می توان با رایانه ها از طریق صحبت ارتباط برقرار نمود، با آنها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستمهای خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول و یا افرادی با آشنایی محدود با کامپیوتر و زبان های خارجی نیز می توانند تنها از طریق صحبت کردن با کامپیوتر ارتباط برقرار نمایند. بازشناسی گفتار تلفنی یکی از کاربردهای بازشناسی گفتار، استفاده از آن در سیستم های تلفنی می باشد که کاربر بتواند در پشت تلفن تنها با بیان عنوان موردنظر به صورت گفتاری، کار خود را انجام دهد. این پروژه تحولی در سیستم های کامپیوتر- تلفنی به وجود آورده است. تشخیص گفتار تلفنی به دلیل شرایط خاص پشت تلفن مانند نویزهای کانال، محدودیت پهنای باند، تنوع نوع گوشی ها، تغییرات شدت صدا، تنوع گوینده و تنوع گویش دارای پیچیدگی های خاص خود است. نیوشا نرم افزار توسعه داده شده برای تشخیص گفتار تلفنی است که به روش های مختلف مقاوم سازی مجهز شده است تا قابل استفاده در کاربردهای واقعی باشد. بازشناسی گفتار روی رایانه های جیبی و پردازنده های خاص یکی از پروژه های موجود در گروه تحقیقات شرکت، بازشناسی گفتار روی رایانه های جیبی، گوشی های همراه و پردازنده های خاصی که عموماً دارای توان پردازشی ضعیف تر بوده و قابلیت پردازش اعداد اعشاری را ندارند، می باشد. موتور بازشناسی گفتار مخصوص اینگونه پردازنده ها آماده شده است که با سرعت و دقت مناسب کار بازشناسی را انجام می دهد. نرم افزار مترجم صوتی و اجرای برنامه صوتی دو نمونه از این نرم افزارها می باشد که روی PDA های آماده شده است.

تشخیص کلمات کلیدی گفتار تشخیص کلمات کلیدی گفتار به معنای پیدا کردن یک کلمه یا عبارت خاص در گفتار می باشد که برای کاربردهای امنیتی، آرشیوهای صوتی و جستجوی صوتی قابل استفاده است. نسخه های تلفنی و غیرتلفنی این نرم افزار آماده شده است و تحقیقت برای بهبود آن ادامه دارد.

کلمات خارج از دادگان و معیار اطمینان برای آماده سازی یک سیستم واقعی، معیار اطمینان یکی از پارامترهای مهم می باشد. به کمک معیار اطمینان می توان دقت را در موارد خاص بررسی نمود و یا در هنگام آموزش از این ویژگی استفاده نمود. کاربرد دیگر معیار اطمینان در بدست آوردن کلمات خارج از دادگان است. کلمات خارج از دادگان یکی از پارامترهای اصلی سیستم های تشخیص فرامین صوتی می باشد.

بهبود کیفیت گفتار در زمینه بهبود کیفیت گفتار روشهای تفریق طیفی، Wiener Filter، Signal sub-space و Array Processing beam-forming پیاده سازی و تست شده است.

تشخیص گفتار از غیر گفتار (VAD) برای بازشناسی گفتار پیوسته یا بازشناسی دستورات صوتی در یک رایانه بدون مشخص بودن شروع یا پایان آواها، لازم است که بدانیم گفتار از کجا شروع شده و تا کجا ادامه دارد. به همین دلیل لازم است قسمت گفتار از سکوت جدا شود تا پردازش فقط روی گفتار انجام گیرد. در این تحقیقات دو روش جدید پیاده سازی شده است و از روش های استاندارد ETSI's AMR، ITU-T's G.722 VAD برای مقایسه و ارزیابی کارایی استفاده می شود.

بازشناسی با فاصله و آرایه میکروفنی تحقیقات گسترده ای در زمینه بازشناسی گفتار از راه دور که منبع صوت دور از میکروفن بوده و همچنین در زمینه استفاده از آرایه میکروفنی در حال انجام است.

روخوانی متن (TTS) تحقیقات ابتدایی در زمینه روشهای تبدیل متن به گفتار انجام گرفته است. کارهای انجام گرفته بیشتر در محدوده مدل زبانی و آماده نمودن برنامه های اولیه TTS است.

تشخیص گفتار بومی از غیربومی این کارتحقیقاتی برای زبان فنلاندی شروع شد و تا حدودی کار برای زبان فارسی انجام شده است. با استفاده از این روش می توان امتیاز، دقت و درست بودن لهجه، بین یک گوینده با لهجه غیربومی و فرد دیگری با لهجه بومی را پیدا نمود.

محاسبه سریع معیارشباهت یکی از بارهای محاسباتی در الگوریتم های بازشناسی گفتار بدست آوردن مقدار شباهت است که یکی از گلوگاه های سیستم های بازشناسی گفتار می باشد. روش های بهینه ای برای محاسبه مقدار شباهت پیاده سازی شده و به کار گرفته شده است.

فناوری تشخیص گفتار نرم افزاری است که قادر است صوت را به متن تبدیل کند. فناوری تشخیص گفتار به رایانه ای که توانایی دریافت صدا را دارد برای مثال به یک میکروفن مجهز است این قابلیت را می دهد که صحبت کاربر را متوجه شود٫این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزین برای ارتباط با رایانه کاربرد دارد. برقراری ارتباط گفتاری با رایانه ها به جای استفاده از صفحه کلید و ماوس یکی از زمینه های تحقیقاتی مهم چند دههٔ اخیر است و شرکت های بزرگی چون مایکروسافت ٫فیلیپس ٫ ای ال ای تی ٫ ای بی ام ٫سالانه هزینه های هنگفتی را برای این منظور پرداخت کرده و می کنند.

از جمله محدودیت های این نرم افزار این است که کلماتی که در این نرم افزار وجود دارد کلماتی است که از قبل به نرم افزار معرفی شده است. ضمن ان که در این نرم افزار کلمات محاوره ای قابل شناسایی نیست. از جمله کاربردهای این نرم افزار در ادارات و سازمان ها برای کاهش به کارگیری نیروی انسانی بهره برد. همچنین افزایش امنیت نیز یکی دیگر از قابلیت های استفاده از این نرم افزار است.

پیش گفتار بخش آغازین یک کتاب یا مقاله یا انشا است که هدف و ساختار اثر را شرح می دهد.

در متن های تخصصی معمولاً پیش گفتار شامل چکیدهٔ مقاله، معرفی، مقدمه و ... است. در واقع قسمت پیشگفتار می تواند یک فصل کتاب را تشکیل دهد.

تکرار گفتار (به انگلیسی: Speech Repetition) توسط یک شخص، از واکهی گفته شده که توسط شخص دیگری ساخته شده است، تولید می شود. (تکرار گفتار) مستلزم داشتن این توانایی است که افراد صدایی را که از تلفظ صوتی شخص دیگری می شنوند، دریافت کرده و بصورت آوای خروجی مشابهی، از دستگاه صوتی خود تولید کنند.

این تقلید خروجی ورودی گفتار، اغلب بطور مستقل از درک گفتار رخ می دهد. مثل دنبال کردن گفتار، زمانی که یک شخص بطور ناخودآگاه کلمات شنیده شده درگوشی تلفن را بیان می کند. یا شرایط آسیب شناختی پژواک، گویی چنان که افراد خودشان کلماتی را که از راه دور می شنوند، تکرار می کنند. این ارتباط برای

تکرار گفتار

کلمات در مغز برای تکرار گفتار جدا شده است. تکرار گفتار در جریان روند گفتار پسین اتفاق می افتد، درحالی که درک گفتار در جریان روند گفتار پیشین رخ می دهد. تکرارها اغلب توسط این مسیر در جملات فی البداهه بطور فوری یا بعد از تاخیر در حافظه واج شناسی ناآگاهانه ثبت شده اند.

در انسان، توانایی برای ترسیم تلفظ صوتی ورودی شنیداری، در خروجی متحرک، درسطح بالایی توسعه یافته است. در این میان توانایی کپی کردن، یک نقش بحرانی را درپیشرفت سریع یک بچه در کلمات گفته شده اش ایفا می کند. در بچه های بزرگتر و بزرگسالان هم اهمیت این موضوع هنوز باقی مانده است. چرا که این امر آنها را به ادامه یادگیری نام ها و کلمات جدید و زبانی دیگر قادر می سازد. چنین تکراری برای ترویج زبان از یک نسل به نسلی دیگر هم ضروری است. به علاوه اینطور پیشنهاد شده بوده که واحدهای واجی که خارج از گفتار ساخته شده، بوسیله روند توسعه و ارسال کلمات انتخاب شده اند. بدلیل اینکه بچه ها ترجیحاً کپی کردن کلمات واحدهای ابتدایی را به لحاظ آسانتر بودن، تقلید می کردند.

عکس گفتار (به انگلیسی: Photovoice) روشی است که عمدتاً در رشتهٔ توسعهٔ اجتماعی، بهداشت عمومی، و آموزش و پرورش استفاده می شود که عکاسی را با کنش اجتماعی مردمی ترکیب می کند. در این روش از شرکت کنندگان خواسته می شود بر اساس دیدگاه شخصی شان یا به نمایندگی از جامعهٔ خود عکاسی کنند و در مورد عکس ها بحث کنند، و روایات مربوط به عکس های خود را گسترش دهند، و با کمک رسانی یا دیگر اعمال انسانی جامعهٔ خود را یاری دهند. این روش اغلب در میان مردم به حاشیه رانده شده استفاده می شود، و به عنوان روشی در نظر گرفته می شود تا به ما بینش دهد آن ها چگونه شرایطی دارند و امیدشان به آینده را مفهوم سازی کنند. عکس گفتار تلاش می کند از زندگی کسانی که به طور سنتی متفاوت از میانگین تصورشده (کلیشه های) دنیا هستند برای کسانی که در فرایند سیاست گذاری قرار دارند، چشم اندازی ایجاد کند. عکس گفتار همچنین پاسخی به مسائل مطرح شده در طول تاریخ از بازنمایی جوامع بشری است.

آغل گفتار قناتی است که در روستای سمسکنده سفلی از توابع بخش میاندرود، شهرستان ساری در استان مازندران قرار دارد.

متن به گفتار (به انگلیسی: Text-to-Speech) که سرواژه آن TTS است، برنامه ای است که متن ورودی را به صدای انسان را می خواند.

این نوع برنامه برای تبدیل متن به پرونده صوتی (کتاب گویا)، تلفظ کلمات در نرم افزارهای واژه نامه، خواندن صفحه رایانه و نیز تلفن هوشمند مخصوصاً برای کاربران نابینا توسط نرم افزارهای صفحه خوان کاربرد دارد. همچنین در سامانه های تلفن مخابرات و نیز دستگاه های خودپرداز جهت ارتباط گفتاری با کاربر بکار می رود.

باید توجه کرد که اصطلاح «متن به گفتار» برای اشاره به دو مفهوم متفاوت بکار می رود:

الف) موتور متن به گفتار (به انگلیسی: Text-to-Speech engine)

ب) پخش کننده متن به گفتار (به انگلیسی: Text-to-Speech player)

که وظیفه تبدیل متن به گفتار در پس زمینه بر عهده موتور متن به گفتار است و پخش کننده متن به گفتار محیط کاربری برای وارد کردن متن و گرفتن خروجی صدا یا ذخیره در قالب پرونده صوتی را فراهم می کند. به منظور جلوگیری از ابهام معمولاً موتور متن به گفتار اصطلاحاً (به انگلیسی: Speech-synthesizer) نامیده می شود از طرف دیگر پخش کننده متن به گفتار مخصوصاً در بین کاربران عام رایانه متن به گفتار نامیده می شود. لیکن باید توجه کرد زبانهای پشتیبانی شده گفتار و کیفیت صدا مربوط به موتور متن گفتار است و یک موتور متن به گفتار با رابط برنامه نویسی (API) به راحتی در نرم افزارهای گوناگون (پخش کننده های متن به گفتار) قابل فراخوانی و استفاده است.

بطور کلی برای تبدیل متن به گفتار نیاز است تا پارامترهای مهم در تولید گفتار استخراج و استفاده شوند. استخراج بعضی از این پارامترها همچون رشته آوایی نوشتار، کشش زمانی واجها و منحنی پیچ گفتار الزامی و بعضی دیگر همچون سرعت بیان، درنگ بین کلمات و تن صدا از جمله پارامترهای غیر ضروری می باشند که استفاده از آنها منجر به بهبود خروجی سیستم می گردد. پیمانه های لازم برای تبدیل متن به گفتار در یک سیستم تولید گفتار از متن عموماً شامل دو بخش است: بخش پردازش زبان طبیعی اجزاء سازنده متن ورودی شامل کلمات، گروه های گرامری، جمالت و دیگر اطلاعات مرتبط با پردازش زبان که در بخش پردازش سیگنال دیجیتالی به عنوان ورودی مورد نیاز است تهیه می کند. بخش پردازش دیجیتالی سیگنال با استفاده از نتایج حاصل از بخش NLP، پارامترهای گفتار را شامل رشته آوایی متن و پارامترهای نوایی تعیین و در انتها گفتار خروجی با استفاده از یک موتور سنتز تولید می گردد.

لهجه ترکیبی از سه مولفه اصلی: آهنگ، اتصال کلمات و طرز تلفظ واجهاست . تحلیل های مبتنی بر ابزارهای آماری چند متغیره مانند PCA و ICA نشان میدهند که لهجه یکی از عوامل کلیدی در ایجاد تمایز میان گویندگان مختلف است

. مشکلات ناشی از تنوع لهجه به اندازه تنوع جنسیت می تواند تأثیرگذار باشد. بنابراین، نیاز به سیستمی که بتواند بخوبی لهجه ها را شناسایی و از هم تفکیک نماید بشدت احساس می شود. دو فاز بسیار مهم که بمنظور تعدیل اثر لهجه به سامانه بازشناسی گفتار اضافه می شوند عبارتند از فاز تطبیق مدل آکوستیکی با لهجه و فاز شناسایی لهجه . در فاز تطبیق مدل آکوستیکی با لهجه، سعی می کنیم به تعداد لهجه های موجود در دادگان، مدل آکوستیکی تطبیق یافته برای آن لهجه ها تولید نماییم و در فاز شناسایی لهجه، به تعیین لهجه یک جمله یا یک گوینده می پردازیم تا در مرحله بازشناسی بتوانیم مدل آکوستیکی تطبیق یافته مناسب را برای آن نمونه انتخاب کنیم.

زبان ها دارای پدیده هایی هستند. این پدیده های زبانی بر دو گونه اند: اول برش پذیرها یا پدیده های زنجیری که در زنجیره گفتار قرار می گیرند. دوم پدیده های زنجیری که بر روی زنجیره گفتار هستند نه در زنجیره، به نام زبرزنجیری یا ویژگی های نوای گفتار (انگلیسی: Prosody).

برگردان گفتار نظریه ای شبه علمی است که نخستین بار توسط دیوید جان اوتس ارائه شد. این نظریه پس از نمایش در برنامه تاک-شو شبانه آرت بل در رادیو مورد توجه مردم قرار گرفت. در این نظریه باور او بر این است که انسان به هنگام خَلق گفتار، ناخودآگاه پیام های پنهانی را می آفریند که نمایانگر بینشی است از اندیشه های درونی او. اوتس مدعیست که نظریه اش در روان درمانی، جرم شناسی و گفتگوهای تجاری کاربرد دارد. اگرچه ادعاهای او ازسوی مردم، علم و انجمن های آکادمیک مردود اعلام شده است.

کاظم راست گفتار (زاده دوم فروردین ۱۳۴۲ در شیراز) کارگردان ایرانی است.

آیا این مطلب برای شما مفید بود؟




ارسال نظر

نام


ایمیل


نظر