PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : به گوش هاي خود اعتماد نكنيد



Mahmood Mokhtari
03-11-2008, 18:14
به گوش هاي خود اعتماد نكنيد

فناوري هاي تازه براي تشخيص صدا

مترجم: نسترن صائبي

در يكي از چهارراه هاي شهر لوئيس ويل انگليس يك دوربين هوشمند كنترل ترافيك نصب شده كه مي تواند صدا ها را تفكيك كند. اين دوربين مي تواند صداي خرد شدن يا سايش چرخ اتومبيل ها را حين تصادف از ديگر صدا ها متمايز كند. دوربين هوشمند كنترل ترافيك با شنيدن اين صدا ها، خود به خود به سمت آن مي چرخد و از صحنه تصادف فيلمبرداري مي كند. دوربين مذكور «ماشين شنوا» ناميده مي شود كه صدا ها را درك مي كند و به خوبي به آنها واكنش نشان مي دهد.
در حال حاضر دستگاه هاي مختلفي از Playstation Eyetoy سوني گرفته تا دوربين هاي امنيتي كه آنچه را مي بيند، تشخيص مي دهد و افراد و حركات مشكوك را شناسايي مي كند، عرضه شده است، اما كمتر سيستمي مي تواند خنده هاي يك كودك را از صحبت هاي خسته كننده و نيشخند هاي افراد حاضر در يك مهماني تشخيص دهد.
«مارك پلامبلي» استاد دانشگاه لندن بر اين باور است كه به زودي شاهد ظهور فناوري هاي نوين صوتي خواهيم بود. «پلامبلي» كه يكي از پيشگامان توسعه دستگاه هاي ديجيتال با قابليت تشخيص صدا است، قرار است طي يك پروژه پنج ساله و با بودجه 2/1 ميليون پوند، روي فناوري ماشين هاي شنيداري پيشرفته يي كار كند كه در زمينه سلامت، امنيت و صنايع خلاقانه كاربرد خواهد داشت.
«پلامبلي» مي گويد: «من قصد دارم همكاري گروه هاي تحقيقاتي ماشين ها و دستگاه هاي ديداري و حسگر هاي زيستي را با همديگر گسترش دهم تا به مباني اوليه و كلي تحليل صدا دست پيدا كنيم.»
تحليل ديداري، كار نسبتاً آساني است، چون به طور كلي اشياي نزديك، اشياي دور را تار مي كنند، اما اين در حالي است كه صداي دوردست با وجود تمام صدا هاي پس زمينه و زائد باز هم قابل تشخيص است و به گوش مي رسد. «پلامبلي» به دنبال دست يافتن به الگوريتمي است كه بتوان صداي مورد نظر را از صدا هاي ديگر متمايز ساخت.
از اين گذشته، اين فناوري بازار مناسبي را پيش رو دارد چون درحال حاضر شركت هايي چون گوگل، بي بي سي و شركت ساخت ابزار كمك شنوايي Oticon and Phonac از اين فناوري حمايت كرده اند.
اما تا زماني كه «پلامبلي» به اهداف تعيين شده اش دست پيدا كند، فناوري هاي شنيداري تنها صدا هايي را شناسايي خواهد كرد كه برايش تعريف شده است.
براي مثال دوربين كنترل ترافيك مورد نظر مي تواند فيلم ها را هم براساس يك ترتيب خاص فهرست كند. «پاريس اسماراگديس» دانشمند ارشد تحقيقات آزمايشگاه فناوري هاي پيشرفته شركت Adobe مي گويد: «اگر تعداد زيادي فيلم داشته باشيد، دوربين كنترل ترافيك هوشمند مي تواند در ميان همه فيلم ها جست وجو كند و سكانس هايي را كه صداي شليك و تير اندازي در آنها وجود دارد، جدا و دسته بندي كند. در واقع طبقه بندي صوتي آسان تر از طبقه بندي تصويري است، چون به اين ترتيب مجبور نمي شويد تمام صحنه هاي يك فيلم را بررسي و زير و رو كنيد.»
وي پيش از اين در طراحي يك سيستم جست وجوي محدود صوتي براي شركت ميتسوبيشي نقش داشته است. «اسماراگديس» مي گويد: «ما مي خواهيم سيستمي را طراحي كنيم كه هر دستگاهي را بررسي كند و از روي صداي آن، به نقص فني پي ببرد، يا گوشي طبي هوشمندي بسازيم كه به پزشكان امكان دهد با معاينه بيمار، به وضعيت تنفسي و قلبي - عروقي او پي ببرند.»
«دن اليس» مدير آزمايشگاه تشخيص و سازماندهي دانشگاه كلمبيا بر اين باور است كه هم اكنون زمان مناسبي براي طبقه بندي يوتيوب و پادكست ها است. در حالي كه «متن» با موتور هاي جست وجوي معمولي فهرست مي شود، جست وجوي صوتي به كليدواژه هاي مخصوص نياز دارد.
«اليس» مي گويد: «ايندكس كردن صوتي به درد كساني مي خورد كه در آينده يي نزديك هر لحظه از زندگي شان را با ام پي تري پلير ضبط مي كنند. خود من چند وقت پيش اين كار را امتحان كردم و حالاچند هزار ساعت فايل صوتي از فعاليت هاي عادي و روز مره ام دارم، اما پيدا كردن يك گفت وگوي كوتاه در اين ميان واقعا عذاب آور است. ولي اگر به ياد داشته باشيد كه گفت وگو يا رويداد موردنظر در چه مكاني اتفاق افتاده است، كامپيوتر مي تواند قطعه صوتي مورد نظر را با شناسايي صدا هاي مربوط به آن مكان جدا كند.»
علاوه بر اين «گايرو گيبلز» مدير فناوري هاي نوين انستيتو سلطنتي ملي ناشنوايان انگليس ايندكس صوتي را به نفع افراد ناشنوا مي داند.
وي در اين باره مي گويد: «با بهره گيري از يك سيستم هوشمند مي توانيد اطلاعات مورد نياز افراد ناشنوا را از اطلاعات فرعي متمايز كنيد. براي مثال اين سيستم مي تواند اطلاعات مربوط به پرواز فرد ناشنوا را به اطلاع او برساند.»
اما «پلامبلي» بازار عمده دستگاه هاي تشخيص صدا را صنعت موسيقي مي داند. وي مي گويد: «تصور كنيد لپ تاپي داريد كه قادر است نت هاي يك موسيقي جاز را تشخيص داده و از آن پرينت بگيرد و حتي به عنوان يك نوازنده وارد عمل شود و قطعه و نت منحصر به فرد خود را بنوازد.» روزي خواهد رسيد كه مانند تصاوير اصلاح شده در فتوشاپ، ديگر نمي توانيم به گوش هاي خود و آنچه مي شنويم اعتماد كنيم


منبع: روزنامه اعتماد شماره 1809 مورخه 12/8/87 صفحه 10