2024-12-03 AI mindset V workshop 4
video
presentation
summary
- Общая информация:
- Тема: Творчество и этика в AI, генерация текста, изображений, видео и аудио, обсуждение будущего AI и робототехники.
- Дата: 3 декабря 2024
- Формат: Онлайн-встреча
- Участники/Спикеры: @Alex P, @Gleb K, @Aleksei Ozol, участники лаборатории
1/ review & group work
Александр и Глеб начали лекцию с напоминания о важности использования инструментов транскрипции, таких как Limitless, для ведения заметок и создания конспектов. Были представлены результаты опроса Mentimeter о том, что участники успели попробовать за время лаборатории: большинство попробовало базовые модели (ChatGPT, Claude, Groq), техники промпт-инжиниринга и саммаризацию с помощью AI. Меньше участников попробовали агентов, чат-ботов и инструменты визуализации. Ирина рассказала о результатах опроса о том, чего не хватило на лаборатории. Участники разделились на микрогруппы, чтобы обсудить свои мысли по поводу AI-арта. В группах обсуждались сомнения по поводу того, что можно считать AI-артом, кейсы использования AI для генерации различного контента, а также вопросы этичности и безопасности AI. Вадим поднял тему регулирования и копирайта на AI-генерируемые изображения.
2/ text
Вступление: В этом блоке рассматривалась работа с текстом с помощью AI, от NLP до творческих инструментов. Текст - основа большинства AI-моделей. Были упомянуты инструменты, платформы и подходы для написания, редактирования, анализа и генерации текста. Также обсуждались текстовые игры и их потенциал.
AI tech. Natural Language Processing: Базовые задачи NLP, такие как классификация текста, генерация текста, анализ тональности, суммаризация и логический вывод.
Writing tools:
- ShortlyAI: AI-ассистент, помогающий писать различные типы текстов, от статей до художественных произведений. Использует GPT-3 и предлагает различные режимы написания.
- SudoWrite: Инструмент для писателей, который помогает генерировать идеи, развивать сюжет, улучшать стиль и даже писать код.
- Hemingway: Приложение, анализирующее текст и выделяющее сложные предложения, пассивный залог, адвербы и другие элементы, которые могут затруднить чтение. Помогает сделать текст более ясным и легким для восприятия.
Marketing tools: - Canva: Популярный онлайн-сервис для дизайна, который теперь включает в себя AI-инструменты для генерации презентаций, изображений и текстов.
- Gamma: Платформа для создания и презентации контента с использованием AI. Позволяет создавать интерактивные презентации, веб-сайты и документы.
- UseJack.ai: Платформа для автоматизации маркетинговых задач, таких как создание рекламных кампаний, анализ данных и генерация контента.
- Jasper.ai: AI-ассистент для маркетинга, помогающий писать рекламные тексты, посты в социальных сетях, описания продуктов и т.д.
- Monica.im: AI-инструмент, фокусирующийся на создании маркетинговых текстов с высокой конверсией.
Text games: - AI Dungeon: Текстовая игра с открытым миром, где сюжет генерируется AI в реальном времени на основе действий игрока.
Role play games: - Character.AI: Платформа, позволяющая создавать и общаться с AI-персонажами, задавая им различные роли и сценарии.
3/ images
Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и обработки изображений с помощью AI. Александр и Глеб обсудили различные подходы к созданию изображений, от простых генераторов до более сложных систем с элементами компьютерного зрения. Были затронуты вопросы качества, стилизации, разметки данных и обучения моделей. Также была проведена демонстрация нескольких популярных инструментов и обсуждены их возможности и ограничения. Вадим и Катя поделились своим опытом использования AI для генерации изображений.
AI tech. Computer Vision:
- use-case: Image Classification, Object Detection, Semantic Segmentation.
- model direction: text-to-image, image-to-image, image-to-video, text-to-3D, text-to-audio.
Stable Diffusion: Модель генерации изображений с открытым исходным кодом.
Stable Diffusion GUI: - AUTOMATIC1111: Web-интерфейс для Stable Diffusion.
- ControlNet: Инструмент для управления генерацией изображений в Stable Diffusion.
- ComfyUI: Еще один интерфейс для Stable Diffusion.
Midjourney: Популярный сервис для генерации изображений.
Midjourney query structure:/imagine
,/blend
,/describe
.
FLUX 1.1: Модель, отличающаяся высокой фотореалистичностью. (Ссылка из чата.)
Other models: - Ideogram 2.0: Модель, хорошо работающая с текстом на изображениях.
- Adobe Firefly: Инструмент для интеграции сгенерированных изображений.
- DALLE-3: Модель от OpenAI.
Scribble Diffusion: Инструмент, позволяющий превращать наброски в изображения.
Recraft.ai: Премиум инструмент для генерации и редактирования изображений.
Leaderboard: Hugging Face Leaderboard (Ссылка из чата.)
4/ video
Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и редактирования видео с помощью AI. Александр и Глеб обсудили различные подходы к созданию видео, от генерации коротких клипов до более сложных сцен с реалистичной графикой и анимацией. Были затронуты вопросы качества, реализма, законов физики и этичности использования AI-сгенерированного видео. Также были показаны примеры работы нескольких инструментов и обсуждены их перспективы. Было отмечено, что AI-видеогенерация находится на ранней стадии развития, но уже сейчас позволяет создавать впечатляющие результаты.
Video generation:
- Sora (demos): Новая видеомодель от OpenAI (демо доступны по ссылке: https://x.com/slow_developer/status/1861440783867388298).
- Dream Machine: Платформа для генерации видео с интуитивно понятным интерфейсом. (Ссылка из чата).
- RunwayML / gen3: Платформа для творчества с AI.
- Kaiber: Инструмент для создания анимированных видео из изображений и текста.
- Pika: Не уточнялось.
- Kling: Платформа для создания видео с помощью AI.
Video avatars: - D-ID: Платформа для создания говорящих аватаров.
- HeyGen: Инструмент для генерации видео с говорящими персонажами.
- Synthesia: Платформа для создания видео с AI-ведущими.
[VASA-1 (Microsoft)]: Технология для генерации говорящих лиц в реальном времени (не доступна публично).
Video editing: - Descript: Инструмент для редактирования видео и аудио с помощью текста.
- Canva AI: AI-инструменты в Canva для редактирования видео.
- Adobe Premiere Al: AI-функции в Adobe Premiere.
5/ audio
Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и обработки аудио с помощью AI. Александр и Глеб обсудили различные подходы к созданию музыки, голосовых интерфейсов и других аудиоматериалов. Были затронуты вопросы качества, эмоциональности, этичности использования AI-сгенерированного аудио и перспектив развития технологий. Алексей поделился своим опытом использования Udio для создания музыки.
Voice interfaces:
- Hume.AI: Платформа, специализирующаяся на эмоциональном AI.
- AI Personalities: Различные AI-персональности с уникальными голосами и стилями общения.
Endel: Приложение, генерирующее персонализированные звуковые ландшафты.
Udio: Сервис для создания музыки с помощью AI.
Suno: Платформа для генерации музыки с AI.
RIPXDAW: AI-powered DAW (Digital Audio Workstation) для создания и редактирования музыки.
Stable Audio: Сервис для генерации высококачественного аудио.
ElevenLabs: Платформа для генерации реалистичной речи и создания пользовательских голосов.
6/ ethics
Вступление: В этом блоке обсуждались этические аспекты использования AI. Были представлены две противоположные точки зрения: технооптимизм (e/acc) и технопессимизм (DOOM). Также был предложен тест: Doomer or E/Acc Alignment Test. Были рассмотрены вопросы безопасности, ответственности, приватности и предвзятости AI. Катя подняла важный вопрос о будущем человечества в контексте развития AI и робототехники.
e/acc (Effective accelerationism): Философское и социальное движение, которое поддерживает ускоренное развитие технологий, в том числе AI, считая, что это приведет к позитивным изменениям в обществе и цивилизации. Представители: Marc Andreessen, Jeff Bezos, Nick Land, Sam Altman.
DOOM: Противоположное e/acc движение, которое видит в развитии AI экзистенциальную угрозу для человечества. Представители: Tristan Harris, Elon Musk, Ilya Sutskever, Eliezer Yudkowsky.
AI alignment: Концепция, занимающаяся проблемой согласования целей AI с человеческими ценностями. Существует несколько подходов к AI alignment: экзистенциальное выравнивание (цели AI не противоречат выживанию человечества), целенаправленное выравнивание (AI преследует цели своих создателей) и кодифицированное выравнивание (AI следует определенному набору правил). John Vervaeke предлагает выравнивать AI с "Богом" или высшими ценностями.
6/ self study
Что делать дальше:
Refs:
- 2024-12-03 {transcript} AI mindset V workshop 4.md - Транскрипт лекции.
- [[2024-12-03 {chat} AI mindset V workshop 4.txt]] - История чата.