تصاویری از حضور فریده سپاه‌منصور در تجمعات شبانه

ورود پادشاه انگلیس به آمریکا؛ مأموریت چارلز برای احیای روابط

فیلم بیشتر »»

کامالا هریس: ترامپ میلیارد‌ها دلار هزینه جنگی اختیاری می‌کند که مردم آمریکا آن را نمی‌خواهند

متکی: حضور ناو و پایگاه‌های امریکایی را در منطقه نمی‌پذیریم

آموزش زبان انگلیسی بیشتر »»

درس سی و یکم زبان

درس سی ام

در حاشیه

پست پرویز پرستویی: رستم را به بهانه رد خون پسر بر دستانش، تنها رها کردند (عکس)

کتایون ریاحی در سریال «پدرسالار» 31 سال قبل (عکس)

بوسه خواننده پاپ بر کتف محمود کریمی مداح (عکس)

شب همدلی هنرمندان و خانواده‌های آسیب دیده از جنگ ؛ هادی حجازی‌فر، مهراوه شریفی‌نیا، بهناز جعفری و ... (+عکس)

پست لاله مرزبان بازیگر برای شهدا مدرسه میناب: من با خاموش شدن هر جان، قلبم می‌شکند

100 سالگی

قیمت انواع فرش ایرانی در بازار آلمان اعلام شد +عکس

۳۵ قصاب در تهران تحت تعقیب قرار گرفتند +اسامی

حاجی فیروزها در تهران بازداشت شدند! +عکس و جزئیات

قیمت گوشت و مرغ و زولبیا و بامیه در ماه رمضان ۳۰ سال پیش!

عکس منتشرنشده از فرزند و همسر آیت‌الله مدرس

باشگاه مغز

آیا می توانید منطق پنهان این ضرب های عجیب را کشف کنید؟

معمای تصویری؛ افراد با دقت زیر 15 ثانیه به جواب می رسند

معمای مثلث ها؛ خیلی ها نمی توانند زیر 30 ثانیه این معما را حل کنند!

معمای ریاضی؛ اگر زیر 30 ثانیه جواب را پیدا کنید، یک نابغه هستید!

تست بینایی و تمرکز؛ 90 درصد افراد در پیدا کردن این جغد شکست می خورند؛ شما چطور؟

معمای ریاضی لوزی های جادویی؛ عدد مجهول را پیدا کنید!

تست 10 ثانیه ای بینایی: یک سرگرمی نه چندان دشوار

عصرايران دو » خواندنی ها و دیدنی ها

کد خبر ۱۰۱۸۷۲۸

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۰۶:۰۰ - ۱۴-۰۹-۱۴۰۳

‌گزارش خطا در خبر

عصرايران دو » خواندنی ها و دیدنی ها

کد ۱۰۱۸۷۲۸

انتشار: ۰۶:۰۰ - ۱۴-۰۹-۱۴۰۳

تصویرسازی هوش مصنوعی از خیابان‌ها با گوش دادن به صدای آنها

هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی می‌تواند از شنیدن آن برای تولید تصاویر آنها استفاده کند.

در حالی که هم اکنون مدل‌های هوش مصنوعی وجود دارند که جلوه‌های صوتی را برای مطابقت با تصاویر بی‌صدا از خیابان‌ها و مکان‌های دیگر تولید می‌کنند، یک فناوری جدید آزمایشی دقیقاً برعکس عمل می‌کند و تصاویر را با دقت عجیبی از صدای خیابان‌ها تولید می‌کند.

به گزارش ایسنا و به نقل از نیو اطلس، پروفسور یوهائو کانگ و همکارانش از دانشگاه تگزاس در آستین، یک مدل تبدیل صدا به تصویر را بر روی مجموعه داده‌ای از کلیپ‌های صوتی و تصویری ۱۰ ثانیه‌ای آموزش داده‌اند.

این کلیپ‌ها شامل تصاویر ثابت و صدای محیطی بود که از ویدیوهای یوتیوب از خیابان‌های شهری و روستایی در آمریکای شمالی، آسیا و اروپا گرفته شده بود.

این سیستم با استفاده از الگوریتم‌های یادگیری عمیق، نه تنها یاد گرفت که کدام صداها با کدام موارد درون تصاویر مطابقت دارند، بلکه همچنین تشخیص داد که کیفیت صدا با کدام محیط بصری مطابقت دارد.

هنگامی که آموزش این سیستم کامل شد، هوش مصنوعی وظیفه تولید تصاویر را بر اساس صدای محیطی ضبط شده از ۱۰۰ کلیپ دیگر که از خیابان‌ها ضبط شده بود، بر عهده گرفت و برای هر ویدیو یک تصویر تولید کرد.

متعاقباً گروهی از داوران انسانی هر یک از آن تصاویر را در کنار دو تصویر تولید شده از خیابان‌های دیگر مشاهده کردند، در حالی که به صدای ویدیویی که تصویر بر اساس آن ساخته شده بود، گوش می‌دادند. وقتی از آنها خواسته شد که تشخیص دهند کدام یک از این سه تصویر با موسیقی متن مطابقت دارد و آنها به طور متوسط با ۸۰ درصد دقت تواستند تشخیص دهند.

علاوه بر این، هنگامی که تصاویر تولید شده توسط رایانه تجزیه و تحلیل شد، تصاویر تولید شده از آسمان، فضای سبز و ساختمان‌ها به شدت با تصاویر واقعی موجود در ویدئوهای اصلی مرتبط بود.

در واقع در بسیاری از موارد، تصاویر تولید شده، شرایط نوری ویدئوهای منبع، مانند آسمان آفتابی، ابری یا شبانه را نیز منعکس می‌کردند. این ممکن است با عواملی مانند کاهش صدای ترافیک در شب یا صدای حشرات شبانه امکان‌پذیر شده باشد.

اگرچه این فناوری می‌تواند کاربردهایی مانند دریافت یک ایده تقریبی از محل ضبط صدا در پزشکی قانونی داشته باشد، اما هدف این مطالعه بیشتر بررسی این است که چگونه صدا به حس مکان ما کمک می‌کند.

دانشمندان این مطالعه می‌گویند: نتایج می‌تواند دانش ما را در مورد تأثیر ادراکات دیداری و شنیداری بر سلامت روان انسان افزایش دهد و همچنین ممکن است شیوه‌های طراحی شهری را بهینه کند و کیفیت کلی زندگی در جوامع را بهبود بخشد.

این مطالعه در مجله Nature منتشر شده است.

پربیننده ترین پست همین یک ساعت اخیر

گروسی: دوران اجماع جهانی علیه ایران به پایان رسیده است

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

11 آجیل و دانه پرمنیزیم که باید بشناسید

بیشتر بخوانید:

توقف انتشار قابلیت تصویرسازی رایگان GPT-4o به دلیل وایرال شدن این سبک خاص!

هوش مصنوعی؛ انقلاب علمی یا چالش بی‌نظمی جهانی؟ (فیلم)

تماشاخانه