2024-12-03 AI mindset V workshop 4

video

presentation

summary

Общая информация:
- Тема: Творчество и этика в AI, генерация текста, изображений, видео и аудио, обсуждение будущего AI и робототехники.
- Дата: 3 декабря 2024
- Формат: Онлайн-встреча
- Участники/Спикеры: @Alex P, @Gleb K, @Aleksei Ozol, участники лаборатории

1/ review & group work

Александр и Глеб начали лекцию с напоминания о важности использования инструментов транскрипции, таких как Limitless, для ведения заметок и создания конспектов. Были представлены результаты опроса Mentimeter о том, что участники успели попробовать за время лаборатории: большинство попробовало базовые модели (ChatGPT, Claude, Groq), техники промпт-инжиниринга и саммаризацию с помощью AI. Меньше участников попробовали агентов, чат-ботов и инструменты визуализации. Ирина рассказала о результатах опроса о том, чего не хватило на лаборатории. Участники разделились на микрогруппы, чтобы обсудить свои мысли по поводу AI-арта. В группах обсуждались сомнения по поводу того, что можно считать AI-артом, кейсы использования AI для генерации различного контента, а также вопросы этичности и безопасности AI. Вадим поднял тему регулирования и копирайта на AI-генерируемые изображения.

2/ text

Вступление: В этом блоке рассматривалась работа с текстом с помощью AI, от NLP до творческих инструментов. Текст - основа большинства AI-моделей. Были упомянуты инструменты, платформы и подходы для написания, редактирования, анализа и генерации текста. Также обсуждались текстовые игры и их потенциал.
AI tech. Natural Language Processing: Базовые задачи NLP, такие как классификация текста, генерация текста, анализ тональности, суммаризация и логический вывод.
Writing tools:

ShortlyAI: AI-ассистент, помогающий писать различные типы текстов, от статей до художественных произведений. Использует GPT-3 и предлагает различные режимы написания.
SudoWrite: Инструмент для писателей, который помогает генерировать идеи, развивать сюжет, улучшать стиль и даже писать код.
Hemingway: Приложение, анализирующее текст и выделяющее сложные предложения, пассивный залог, адвербы и другие элементы, которые могут затруднить чтение. Помогает сделать текст более ясным и легким для восприятия.
Marketing tools:
Canva: Популярный онлайн-сервис для дизайна, который теперь включает в себя AI-инструменты для генерации презентаций, изображений и текстов.
Gamma: Платформа для создания и презентации контента с использованием AI. Позволяет создавать интерактивные презентации, веб-сайты и документы.
UseJack.ai: Платформа для автоматизации маркетинговых задач, таких как создание рекламных кампаний, анализ данных и генерация контента.
Jasper.ai: AI-ассистент для маркетинга, помогающий писать рекламные тексты, посты в социальных сетях, описания продуктов и т.д.
Monica.im: AI-инструмент, фокусирующийся на создании маркетинговых текстов с высокой конверсией.
Text games:
AI Dungeon: Текстовая игра с открытым миром, где сюжет генерируется AI в реальном времени на основе действий игрока.
Role play games:
Character.AI: Платформа, позволяющая создавать и общаться с AI-персонажами, задавая им различные роли и сценарии.

3/ images

Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и обработки изображений с помощью AI. Александр и Глеб обсудили различные подходы к созданию изображений, от простых генераторов до более сложных систем с элементами компьютерного зрения. Были затронуты вопросы качества, стилизации, разметки данных и обучения моделей. Также была проведена демонстрация нескольких популярных инструментов и обсуждены их возможности и ограничения. Вадим и Катя поделились своим опытом использования AI для генерации изображений.
AI tech. Computer Vision:

use-case: Image Classification, Object Detection, Semantic Segmentation.
model direction: text-to-image, image-to-image, image-to-video, text-to-3D, text-to-audio.
Stable Diffusion: Модель генерации изображений с открытым исходным кодом.
Stable Diffusion GUI:
AUTOMATIC1111: Web-интерфейс для Stable Diffusion.
ControlNet: Инструмент для управления генерацией изображений в Stable Diffusion.
ComfyUI: Еще один интерфейс для Stable Diffusion.
Midjourney: Популярный сервис для генерации изображений.
Midjourney query structure: /imagine, /blend, /describe.
FLUX 1.1: Модель, отличающаяся высокой фотореалистичностью. (Ссылка из чата.)
Other models:
Ideogram 2.0: Модель, хорошо работающая с текстом на изображениях.
Adobe Firefly: Инструмент для интеграции сгенерированных изображений.
DALLE-3: Модель от OpenAI.
Scribble Diffusion: Инструмент, позволяющий превращать наброски в изображения.
Recraft.ai: Премиум инструмент для генерации и редактирования изображений.
Leaderboard: Hugging Face Leaderboard (Ссылка из чата.)

4/ video

Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и редактирования видео с помощью AI. Александр и Глеб обсудили различные подходы к созданию видео, от генерации коротких клипов до более сложных сцен с реалистичной графикой и анимацией. Были затронуты вопросы качества, реализма, законов физики и этичности использования AI-сгенерированного видео. Также были показаны примеры работы нескольких инструментов и обсуждены их перспективы. Было отмечено, что AI-видеогенерация находится на ранней стадии развития, но уже сейчас позволяет создавать впечатляющие результаты.
Video generation:

Sora (demos): Новая видеомодель от OpenAI (демо доступны по ссылке: https://x.com/slow_developer/status/1861440783867388298).
Dream Machine: Платформа для генерации видео с интуитивно понятным интерфейсом. (Ссылка из чата).
RunwayML / gen3: Платформа для творчества с AI.
Kaiber: Инструмент для создания анимированных видео из изображений и текста.
Pika: Не уточнялось.
Kling: Платформа для создания видео с помощью AI.
Video avatars:
D-ID: Платформа для создания говорящих аватаров.
HeyGen: Инструмент для генерации видео с говорящими персонажами.
Synthesia: Платформа для создания видео с AI-ведущими.
[VASA-1 (Microsoft)]: Технология для генерации говорящих лиц в реальном времени (не доступна публично).
Video editing:
Descript: Инструмент для редактирования видео и аудио с помощью текста.
Canva AI: AI-инструменты в Canva для редактирования видео.
Adobe Premiere Al: AI-функции в Adobe Premiere.

5/ audio

Вступление: В этом блоке были рассмотрены инструменты и технологии для генерации и обработки аудио с помощью AI. Александр и Глеб обсудили различные подходы к созданию музыки, голосовых интерфейсов и других аудиоматериалов. Были затронуты вопросы качества, эмоциональности, этичности использования AI-сгенерированного аудио и перспектив развития технологий. Алексей поделился своим опытом использования Udio для создания музыки.
Voice interfaces:

Hume.AI: Платформа, специализирующаяся на эмоциональном AI.
AI Personalities: Различные AI-персональности с уникальными голосами и стилями общения.
Endel: Приложение, генерирующее персонализированные звуковые ландшафты.
Udio: Сервис для создания музыки с помощью AI.
Suno: Платформа для генерации музыки с AI.
RIPXDAW: AI-powered DAW (Digital Audio Workstation) для создания и редактирования музыки.
Stable Audio: Сервис для генерации высококачественного аудио.
ElevenLabs: Платформа для генерации реалистичной речи и создания пользовательских голосов.

6/ ethics

Вступление: В этом блоке обсуждались этические аспекты использования AI. Были представлены две противоположные точки зрения: технооптимизм (e/acc) и технопессимизм (DOOM). Также был предложен тест: Doomer or E/Acc Alignment Test. Были рассмотрены вопросы безопасности, ответственности, приватности и предвзятости AI. Катя подняла важный вопрос о будущем человечества в контексте развития AI и робототехники.

e/acc (Effective accelerationism): Философское и социальное движение, которое поддерживает ускоренное развитие технологий, в том числе AI, считая, что это приведет к позитивным изменениям в обществе и цивилизации. Представители: Marc Andreessen, Jeff Bezos, Nick Land, Sam Altman.

DOOM: Противоположное e/acc движение, которое видит в развитии AI экзистенциальную угрозу для человечества. Представители: Tristan Harris, Elon Musk, Ilya Sutskever, Eliezer Yudkowsky.

AI alignment: Концепция, занимающаяся проблемой согласования целей AI с человеческими ценностями. Существует несколько подходов к AI alignment: экзистенциальное выравнивание (цели AI не противоречат выживанию человечества), целенаправленное выравнивание (AI преследует цели своих создателей) и кодифицированное выравнивание (AI следует определенному набору правил). John Vervaeke предлагает выравнивать AI с "Богом" или высшими ценностями.

6/ self study

Что делать дальше:

Попробовать AI-инструменты для творчества (Midjourney, DALL-E, Stable Diffusion, RunwayML, Flux, D-ID, Heygen, Elevenlabs).
Делиться своим прогрессом в чате.
Участвовать в коворкинге и DEMO дне.
Заполнить форму обратной связи: Feedback form

Refs:

2024-12-03 {transcript} AI mindset V workshop 4.md - Транскрипт лекции.
[[2024-12-03 {chat} AI mindset V workshop 4.txt]] - История чата.