Історія появи зору та його значення
- 540 мільйонів років тому світ був темним не через відсутність світла, а через відсутність зору.
- Перші організми з зором , трилобіти , відкрили нову реальність, що започаткувало кембрійський вибух різноманіття видів.
- Зір еволюціонував від пасивного сприйняття світла до активного розуміння і дії, що призвело до розвитку інтелекту.
Прогрес у комп’ютерному зорі та штучному інтелекті
- Дев’ять років тому поєднання нейронних мереж, GPU та великих даних (ImageNet) започаткувало сучасну еру ШІ.
- Алгоритми навчилися не лише розпізнавати об’єкти, а й описувати зображення природною мовою.
- Сучасні генеративні моделі (моделі дифузії) створюють нові зображення та відео за текстовими підказками.
Розвиток просторового інтелекту
- Просторовий інтелект поєднує сприйняття з дією у тривимірному світі.
- Нові алгоритми перетворюють 2D-зображення у 3D-моделі, створюють нескінченні простори для дослідження.
- Роботизоване навчання дозволяє системам вчитися діяти у 3D-середовищах, що є ключем до розвитку втіленого інтелекту.
Застосування ШІ у медицині та робототехніці
- Розумні датчики допомагають контролювати гігієну медперсоналу, слідкують за інструментами та попереджають про ризики для пацієнтів.
- Автономні роботи можуть перевозити матеріали, а доповнена реальність допомагає хірургам робити операції безпечнішими.
- Пацієнти з паралічем керують роботами за допомогою мозкових хвиль, що відкриває нові можливості реабілітації.
Майбутнє просторового інтелекту та ШІ
- Просторовий інтелект стане основою для створення цифрових моделей світу, що допоможуть колективній свідомості.
- ШІ, який бачить, розуміє, творить і взаємодіє з тривимірним світом, стане надійним партнером людини.
- Важливо розвивати технології, які ставлять людину в центр, поважають гідність і сприяють процвітанню.
Це відео надихає на розуміння глибокого зв’язку між еволюцією зору, розвитком інтелекту та сучасними технологіями штучного інтелекту, що формують наше майбутнє.
Додаткові ресурси
- Для глибшого розуміння теми, ознайомтеся з Еволюція зору та майбутнє просторового інтелекту ШІ.
- Досліджуйте Майбутнє технологій: розмова з CEO NVIDIA Дженсеном Хуаном для отримання додаткових перспектив.
- Ознайомтеся з впливом штучного інтелекту на суспільство та його майбутнім.
Перекладач: Ilya Rozenberg Дозвольте мені вам щось показати. Якщо бути точним,
я вам нічого не покажу. Це світ 540 мільйонів років тому. Чиста, нескінченна темрява.
Було темно не через брак світла. Було темно через відсутність зору. I xоч сонячне світло проникало крізь 1000 метрів
від поверхні океану і через гідротермальні отвори пронизувало морське дно, сповнене життям,
у цих водах далекого минулого не було жодного ока. Ні сітківки, ні рогівки, ні лінз. Отже, все це світло, все це життя залишилося непобаченим.
То був час, коли самої ідеї бачити не існувало. Це просто ніколи раніше не відбувалося. Поки не відбулося.
Тож з причин, які ми тільки починаємо розуміти, з’явилися трилобіти, перші організми, які могли відчути світло. Вони є першими мешканцями цієї реальності, яку ми сприймаємо як належне.
Вони перші виявили, що є щось інше, крім самих себе. Світ багатьох «Я». Вважається, що здатність бачити почала так званий кембрійський вибух,
період, у якому величезна різноманітність видів тварин залишила нам свої скам’янілості. Те, що почалося як пасивний досвід,
простий акт пропускання світла, незабаром стало набагато активнішим. Нервова система почала розвиватися.
Зір перетворюється на проникливість. Побачення стало розумінням. Розуміння призвело до дій.
І все це породило інтелект. Сьогодні ми більше не задовольняємося лише даром природи — візуальним розумом. Цікавість спонукає нас створювати машини, що бачать так само розумно, як ми
якщо не краще. Дев’ять років тому, у цьому залі, я надала ранній звіт про прогрес комп’ютерного зору,
підгалузі штучного інтелекту. Тоді три потужні сили зійшлися вперше: Сімейство ШІ алгоритмів так звані нейронні мережи.
Швидке спеціалізоване обладнання - графічнi процесори, або GPU. І великі дані.
Наприклад, 15 мільйонів зображень, які моя лабораторія ImageNet збирала роками. Разом вони відкрили епоху сучасного штучного інтелекту. Ми пройшли довгий шлях.
Тоді просто нанесення етикеток на зображення було великим проривом. Але швидкість і точність цих алгоритмів просто швидко покращилися. Щорічний виклик ImageNet під керівництвом моєї лабораторії
оцінював ефективність цього прогресу. І на цьому графіку ви бачите щорічні вдосконалення та етапні моделі.
Ми пішли на крок далі і створили алгоритми, які можуть сегментувати об'єкти або передбачати динамічні зв’язки між ними
в цих роботах, виконаних моїми студентами та співробітниками. І є ще більше. Нагадаємо, минулого разу я показала вам перший алгоритм комп’ютерного бачення
який може описати фотографію природною мовою людини. Це була робота, виконана з моїм блискучим колишнім студентом Андреєм Карпати. Тоді я спробувала удачу й запитала:
«Андрею, чи можемо ми зробити комп'ютери, щоб зробити зворотне?» А Андрій сказав: «Ха-ха, це неможливо». Що ж, як бачимо з цього поста,
останнім часом неможливе стало можливим. Це завдяки сімейству моделей дифузії, які забезпечують сучасний генеративний алгоритм штучного інтелекту,
який може приймати речення, підказані людиною, і перетворювати їх на фотографії та відео чогось абсолютно нового.
Багато з вас бачили останні вражаючі результати Сори від OpenAI. Але навіть без величезної кількості графічних процесорів мій студент та наші співробітники
розробили генеративну відеомодель під назвою Walt за кілька місяців до Сори. І ви бачите деякі з цих результатів.
Є місце для вдосконалення. Я маю на увазі, подивіться на те котяче око і на те, як воно проходить під хвилею, ніколи не промокаючи.
Яка кота-строфа. (Сміх) І якщо минуле є прологом,
ми вчимося на цих помилках і створимо майбутнє, яке ми собі уявляємо. І в цьому майбутньому ми хочемо, щоб ШІ робив усе можливе для нас
або допомагав нам. Протягом багатьох років я кажу що фотографувати - це не те саме, що бачити та розуміти.
Сьогодні я хотіла би додати до цього. Просто бачити недостатньо. Бачити для того щоб робити і вчитися.
Коли ми співдіємо з цим світом у тривимірному просторі та часі, ми вчимося і вчимося бачити і робити краще. Природа створила цей доброчесний цикл бачення та діяльності, що працює
на основі «просторового інтелекту». Щоб проілюструвати вам, що робить ваш просторовий інтелект постійно, подивіться на цю картину.
Підніміть руку, якщо відчуваєте, що хочете щось зробити. (Сміх) За останню частку секунди
ваш мозок подивився на геометрію цієї склянки, її місце в 3D-просторі, її зв’язок зі столом, котом
і всім іншим. І ви можете передбачити, що буде далі. Бажання діяти є вродженим для всіх істот з просторовим інтелектом,
який пов'язує сприйняття з дією. І якщо ми хочемо висунути ШІ за межі його поточних можливостей, ми хочемо більшого, ніж ШІ, який може бачити та говорити.
Ми хочемо ШІ який може творити. Дійсно, ми робимо захоплюючий прогрес. Останні віхи в просторовому інтелекті -
це навчання комп’ютерів бачити, вчитися, творити та вчитися бачити та творити краще. Це непросто.
Природі знадобилися мільйони років, щоб розвинути просторовий інтелект, який залежить від ока яке приймає світло, проектує 2D-зображення на сітківку
та від мозока, який переводить ці дані в 3D-інформацію. Лише нещодавно група дослідників з Google змогла розробити алгоритм, що бере купу фотографій
і переводить їх у 3D-простір, як приклади що ми показуємо тут. Мій учень і наші співробітники зробили крок далі
і створили алгоритм, який бере одне вхідне зображення і перетворює його в тривимірну форму. Ось ще приклади.
Нагадаю, ми говорили про комп’ютерні програми, здатні отримати людське речення і перетворити його на відео. Група дослідників з Мічиганського університету
знайшла спосіб перевести цей рядок речення в 3D-макет кімнати, як показано тут. І мої колеги зі Стенфорда та їхні студенти
розробили алгоритм, який бере одне зображення та створює нескінченно правдоподібні простори для глядачів для вивчення.
Це прототипи перших ознак майбутньої можливості. Такоі, в якій людська раса може взяти весь наш світ і перевести його в цифрові форми
та моделювати багатство та нюанси. Те, що природа неявно зробила з нами в нашому індивідуальному розумі, технологія просторового інтелекту може сподіватися зробити
для нашої колективної свідомості. Оскільки прогрес просторового інтелекту прискорюється, перед нашими очима відбувається нова ера в цьому доброчесному циклі.
Це вперед і назад каталізує роботизоване навчання, ключовий компонент для будь-якої втіленої системи інтелекту, яка потребує розуміння та взаємодії з 3D-світом.
Десятиліття тому ImageNet з моєї лабораторії дозволив створити базу даних мільйонів високоякісних фотографій,
щоб допомогти навчити комп'ютери бачити. Сьогодні ми робимо те саме з поведінкою та діями, щоб навчити комп'ютерів та роботів діяти в 3D-світі.
Але замість того, щоб збирати статичні зображення, ми розробляємо середовища моделювання на основі тривимірних просторових моделей щоб комп’ютери могли мати нескінченну різноманітність
можливостей навчитися діяти. І ви просто бачите невели ку кількість прикладів навчання наших роботів
у проекті під керівництвом моєї лабораторії під назвою Behavior. Ми також досягаємо захоплюючого прогресу в роботизованому мовному інтелекті. Використовуючи введення на основі великої мовної моделі,
мої студенти та наші співробітники є одними з перших команд, які можуть показати роботизовану руку, яка виконує різноманітні завдання на основі усних інструкцій,
як-от відкриття цього ящика або відключення зарядженого телефону. Або робити бутерброди, використовуючи хліб, салат, помідори і навіть поклав серветку для користувача.
Зазвичай я хотіла би трохи більшого на свому бутерброді, але це хороший початок. (Сміх)
У тому первісному океані, в давні часи, здатність бачити і сприймати навколишнє середовище викликала кембрійський вибух взаємодії з іншими формами життя.
Сьогодні це світло досягає цифрових умів. Просторовий інтелект дозволяє машинам взаємодіяти не тільки одна з одною,
але і з людьми, і з тривимірними світами, реальними чи віртуальними. І оскільки це майбутнє формується,
воно матиме глибокий вплив на багато життів. Візьмемо охорону здоров'я як приклад. Протягом останнього десятиліття
моя лабораторія робила деякі з перших кроків у застосуванні штучного інтелекту для вирішення проблем, які впливають на результати лікування та вигорання медичного персоналу.
Разом з нашими співробітниками зі Стенфордської школи медицини та партнерських лікарень ми пілотуємо розумні датчики, які можуть виявляти
клініцистів, які потрапляють у кімнати пацієнтів, не миючи належним чином руки. Або стежити за хірургічними інструментами.
Або попереджати бригади догляду, коли пацієнт знаходиться під фізичним ризиком, наприклад, падіння. Ми вважаємо ці методи формою навколишнього інтелекту,
як додаткові пари очей, які дійсно мають значення. Але я хочу надати ше більше інтерактивної допомоги нашим пацієнтам, клініцистам та медичному персоналу, яким також відчайдушно потрібна додаткова пара рук.
Уявіть собі автономного робота, який перевозить медичні матеріали, а персонал зосереджуються на наших пацієнтах або доповнена реальность, яка направляє хірургів робити операції безпечнішими,
швидшими і менш інвазивними. Або уявіть пацієнтів з сильним паралічем, які контролюють роботів своїми думками. Так так, які мозковими хвилями виконують повсякденні справи,
які ми з вами сприймаємо як належне. Ви бачите це майбутнє в цьому пілотному дослідженні з моєї лабораторії У цьому відео роботизована рука яка готує японську їжу сукіякі
керована лише електричним сигналом мозку, який неінвазивно отримано за допомогою ковпачка ЕЕГ. (Оплески)
Дякую. Поява зору півмільярда років тому перевернуло світ темряви з ніг на голову.
Це розпочало найглибший еволюційний процес: розвиток інтелекту в тваринному світі. Захоплюючий прогрес штучного інтелекту за останнє десятиліття настільки ж вражаючий.
Але я вважаю, що весь потенціал цього цифрового кембрійського вибуху не буде повністю реалізований, поки ми не забезпечимо наші комп’ютери та роботів просторовим інтелектом,
подібно до того, що зробила природа з усіма нами. Це захоплюючий час, щоб навчити нашого цифрового супутника навчитися міркувати
та взаємодіяти з цим прекрасним 3D-простором, який ми називаємо домом, а також створювати ще багато нових світів, які ми всі можемо досліджувати. Здійснити це майбутнє буде непросто.
Це вимагає від усіх нас продуманих кроків і розробки технологій, які завжди ставлять людину в центр. Але якщо ми зробимо це правильно,
комп’ютери та роботи, що працюють на основі просторового інтелекту стануть не лише корисними інструментами, але й надійними партнерами
для підвищення та підвищення нашої продуктивності та людяності, які при цьому поважають нашу індивідуальну гідність та піднімають наше колективне процвітання.
Що мене найбільше захоплює в майбутньому, - це майбутнє, в якому цей ШІ стане більш сприйнятливим, проникливим і просторово усвідомленим,
і приєднається до нас у нашому прагненні завжди зробити світ кращим у найкращий спосіб. Дякую.
(Оплески)
Heads up!
This summary and transcript were automatically generated using AI with the Free YouTube Transcript Summary Tool by LunaNotes.
Generate a summary for freeRelated Summaries

The Impact of AI on Society: Opportunities and Challenges
This video features a discussion among experts on the transformative effects of AI on employment, creativity, and societal structures. They explore both the potential benefits and the risks associated with AI, including job displacement, ethical concerns, and the future of human agency.

人工智慧的影響與未來:從永續性到偏見
在這段演講中,Lilian Chiu探討了人工智慧對社會的影響,包括其對環境的負擔、藝術家的版權問題以及模型中的偏見。她強調了需要透明化和創建工具來衡量這些影響,以確保未來的人工智慧能夠更可信賴和永續。

The Future of Technology: A Conversation with NVIDIA CEO Jensen Huang
Explore insights from Jensen Huang on AI, robotics and the future of computing.

The Future of Robotics: Innovations and Industry Insights
This video discusses the rapid advancements in robotics and AI, highlighting the impending labor shortage and the potential for robots to fill this gap. Key technologies like Omniverse and the new physics engine Newton are introduced, showcasing their role in training robots and enhancing their capabilities.

重工業的未來:數位孿生與AI代理的應用
本視頻探討了數位孿生技術如何在重工業中與AI代理協作,提升機器人和工人的效率。透過模擬環境,NVIDIA的技術能夠即時應對不可預測的事件,優化倉庫運作。
Most Viewed Summaries

A Comprehensive Guide to Using Stable Diffusion Forge UI
Explore the Stable Diffusion Forge UI, customizable settings, models, and more to enhance your image generation experience.

Kolonyalismo at Imperyalismo: Ang Kasaysayan ng Pagsakop sa Pilipinas
Tuklasin ang kasaysayan ng kolonyalismo at imperyalismo sa Pilipinas sa pamamagitan ni Ferdinand Magellan.

Mastering Inpainting with Stable Diffusion: Fix Mistakes and Enhance Your Images
Learn to fix mistakes and enhance images with Stable Diffusion's inpainting features effectively.

Pag-unawa sa Denotasyon at Konotasyon sa Filipino 4
Alamin ang kahulugan ng denotasyon at konotasyon sa Filipino 4 kasama ang mga halimbawa at pagsasanay.

How to Use ChatGPT to Summarize YouTube Videos Efficiently
Learn how to summarize YouTube videos with ChatGPT in just a few simple steps.