Microsoft Build 2024: основные ИИ-анонсы первого дня
- Корпорация Microsoft предложила использовать ассистента Copilot для автоматического выполнения задач.
- Анонсирована мультимодальная модель Phi-3-vision, способная выполнять общие задачи визуального рассуждения.
- В браузере Edge появится ИИ-функция живого перевода видео с YouTube и других сайтов.
- Microsoft и Qualcomm представили «крошечный» ПК Snapdragon для Windows.
- В PowerToys для Windows 11 появится ИИ-функция копирования и вставки.
- Также компания объявила о партнерстве с Академией Хана в области ИИ.
21 мая 2024 года корпорация Microsoft запустила ежегодную трехдневную конференцию для разработчиков Build.
В первый день топ-менеджеры компании много говорили о Windows и искусственном интеллекте.
Агенты ИИ для рутинных задач
По данным техгиганта, скоро предприятия и разработчики смогут создавать кастомные версии Copilot, способные работать как виртуальные сотрудники и выполнять задачи автоматически.
Вместо ожидания запросов пользователя, чат-бота позволят задействовать для мониторинга электронной почты, помощи в адаптации персонала, ввода данных или других рутинных задач, заявили в корпорации. При этом подсказки не потребуются.
«Мы очень быстро поняли, что применение чат-бота просто для диалога крайне ограничивает возможности Copilot сегодня», — отметили в компании.
Пока функцию может опробовать небольшая группа тестировщиков. Позже в 2024 году компания запустит общедоступную предварительную версию Copilot Studio.
Предприятия смогут создать ИИ-агента Copilot, который будет выполнять задачи службы ИТ-помощи, принимать сотрудников и многое другое.
«Copilot превращается из помощников, работающих с вами, в ассистентов, которые работают на вас», — говорится в блоге.
Мультимодальная модель Phi-3-vision
Компания анонсировала новую версию небольшой языковой модели Phi-3. Теперь она может просматривать изображения и отвечать на вопросы о них.
По данным Microsoft, мультимодальный алгоритм Phi-3-vision с 4,2 млрд параметров способен выполнять общие задачи визуального рассуждения. Благодаря «компактности» его можно запускать на мобильных устройствах.
Модель намного меньше, чем DALL-E от OpenAI или Stable Diffusion от Stability AI, и не умеет генерировать картинки, но способна анализировать и понимать их содержимое.
Phi-3-vision доступна в предварительной версии. Другие алгоритмы семейства Phi-3 ― Phi-3-mini, Phi-3-small и Phi-3-medium — можно использовать через библиотеку моделей Azure.
Перевод живых видео в Edge
Корпорация пообещала скоро добавить в браузер Edge ИИ-функцию перевода устного контента в видео в режиме реального времени.
По данным Microsoft, система может дублировать или генерировать субтитры на выбранном языке для роликов с YouTube, LinkedIn, Coursera и других платформ. Также она поддерживает перевод видео с новостных сайтов, например, Reuters, CNBC и Bloomberg.
В будущем компания намерена расширить список ресурсов и языков.
Пока функция умеет переводить с испанского на английский, а также с английского на испанский, итальянский, немецкий, русский и хинди.
В компании уверены, что кроме удобного способа перевода видео новая ИИ-функция Edge сделает ролики более доступными для людей с нарушениями слуха.
«Крошечный» ПК Snapdragon
Компания Qualcomm представила мини-компьютер Snapdragon Dev Kit для Windows. Его цена составляет $899,99.
Устройство оснащено процессором Snapdragon X Elite с GPU производительностью 4,6 TFLOP. Оно включает 32 ГБ оперативной памяти LPDDR5x, 512 ГБ NVMe-накопитель и множество портов.
Размер ПК: 20,3 см х 17,8 см х 3,3 см. Он предлагает Wi-Fi 7, Bluetooth 5.4 и достаточно мощности для одновременной работы трех мониторов 4K.
Продажа Snapdragon Dev Kit для Windows начнется 18 июня 2024 года. Пока неясно, все ли смогут его приобрести.
Копирование и вставка на базе ИИ
Корпорация добавила в набор служебных программ PowerToys для Windows 11 ИИ-функцию Advanced Paste. Она позволяет «на лету» конвертировать содержимое буфера обмена в необходимый формат с помощью искусственного интеллекта.
Advanced Paste включена в PowerToys версии 0.81. После активации с помощью команды Windows Key + Shift + V откроется текстовое окно с предложенными параметрами преобразования: простой текст, markdown и JSON.
При выборе «вставить с ИИ» в настройках функции появится предложение OpenAI ввести желаемую конвертацию ― обобщенный текст, переводы, сгенерированный код, переписывание из повседневного стиля в профессиональный, синтаксис Yoda или другое.
Чтобы использовать Advanced Paste, необходимо добавить ключ API OpenAI в PowerToys, а также купить кредиты для своей учетной записи.
Партнерство с Академией Хана
Помимо описанных новинок Microsoft также объявила о партнерстве с некоммерческой образовательной организацией Академией Хана.
В рамках сделки все преподаватели K-12 в США получат бесплатный доступ к пилотной версии ИИ-ассистента Kanmigo. Он помогает учителям находить способы делать уроки более интересными и увлекательными.
Kanmigo умеет рекомендовать задания, отображать информацию об успеваемости школьников для оценки их прогресса и предоставлять обучающие ресурсы. Он также может создавать планы занятий и предлагать группы для командной работы.
Ранее использование ассистента стоило $4 в месяц. Партнерство с Microsoft позволило Академии Хана бесплатно использовать службу Azure OpenAI для обеспечения работы Khanmigo.
В рамках сделки образовательная организация также поможет корпорации обучать языковые модели Phi-3 и развивать возможности ИИ в математике.
Ранее Microsoft провела специальное мероприятие в преддверии конференции Build 2024, где представила ПК Copilot+, Windows 11 на Arm и множество функций с ИИ.