2024-11-23 AI mindset V office hours 2
video
summary
- Общая информация:
- Тема: Вопросы использования AI для анализа разговоров, обработки фотографий, генерации презентаций, выбора моделей и инструментов, а также технические вопросы по работе с Obsidian, Whisper, ChatGPT, Claude, Perplexity, Limitless и другими инструментами.
- Дата: 23 ноября 2024
- Формат: Онлайн-встреча
- Участники/Спикеры: @Alex P, @Gleb K, участники лаборатории
Вступление: Вторая встреча Office Hours была посвящена разбору практических вопросов и проблем, с которыми столкнулись участники при выполнении заданий прошлой недели. Обсуждались различные подходы к анализу данных с помощью AI, выбор оптимальных инструментов и моделей, а также технические нюансы работы с ними. Участники активно делились своим опытом и предлагали решения.
Вопросы и ответы:
-
Вопрос (Денис): Как проанализировать длинный разговор из Telegram (текст + аудио) на предмет когнитивных искажений?
- Ответ (@Gleb K): Рекомендуется сначала сделать транскрипцию аудио и объединить ее с текстовыми сообщениями. Затем можно загрузить полученный текст в LLM (например, Gemini) или в инструмент для работы с локальными файлами, такой как Vinter или Cursor.
-
Вопрос (Денис): Что такое Vinter и как его использовать?
- Ответ (@Gleb K): Vinter - это клон VS Code, который позволяет задавать вопросы и получать ответы на основе ваших локальных файлов. Он хорошо подходит для работы с большим количеством текстовой информации.
-
Вопрос (Ольга): Чем Vinter отличается от Cursor?
- Ответ (@Gleb K): Vinter более "агентный", он выполняет несколько действий для получения ответа. Cursor же дает ответ в один шаг. Cursor может работать с документами из веб по ссылке, Vinter - нет.
-
Вопрос (Таня): ChatGPT не может проанализировать прикрепленный файл Word. Как сделать презентацию из текста? Какую модель выбрать, если Claude и Gemini недоступны?
- Ответ (@Alex P, @Gleb K): Для работы с большим вордовским файлом рекомендуется сначала конвертировать его в Markdown. Можно использовать Google Docs для экспорта в Markdown или скопировать текст в чат. Для создания презентаций лучше использовать специализированные инструменты, такие как Pitch. Если Claude и Gemini недоступны, можно использовать ChatGPT с платной подпиской (для доступа к Canvas) или Mistral (https://chat.mistral.ai/chat). Также можно рассмотреть Poe (https://poe.com/) как агрегатор моделей.
-
Вопрос (Ольга): Чем лучше всего проводить рисерч?
- Ответ (@Alex P, @Gleb K): Можно использовать Obsidian для хранения результатов рисерча и обращения к моделям AI. Также есть специализированные инструменты, такие как Elicit (https://elicit.com/), для анализа исследований. Глеб рекомендовал комбинировать ChatGPT с поиском и использовать GPT Researcher.
-
Вопрос (Катя): Как работать с большим количеством фотографий?
- Ответ (@Gleb K): Можно написать скрипты для сортировки фотографий по папкам. Есть специализированный софт, такой как Opticull, для отбора фотографий с помощью AI.
-
Вопрос (Владимир): Как настроить системный звук в Limitless и Whisper?
- Ответ (@Gleb K, Денис): Проблема не решена. Денис предложил использовать "микс всего" в Windows.
-
Вопрос (Таня): Какие есть инструменты для распознавания фотографий (для незрячих и для розыска животных)?
-
Вопрос (Денис): Как Глеб настраивает Obsidian?
- Ответ (@Gleb K): Глеб использует мало папок и тэгов, полагаясь в основном на ссылки.
-
Вопрос (Таня): Насколько строго нужно соблюдать правила разметки в Obsidian?
-
Вопрос (Женя): Как сохранять аудио в Obsidian и делать транскрипцию? Какой инструмент лучше использовать для транскрипции русской речи?
- Ответ (@Gleb K, Ольга): Obsidian - это редактор текста, аудио в нем не хранится. Для транскрипции можно использовать Whisper, Limitless, Yandex.Kit. Ольга порекомендовала Yandex.Kit для русской речи, но отметила, что он сложен в использовании. Александр предложил WhisperTranscribe (https://www.whispertranscribe.com/download).
Инструменты:
- Groq (https://groq.com/): Быстрый инференс AI-моделей.
- Limitless (https://www.limitless.ai/): Транскрипция в реальном времени.
- ChatGPT (https://chat.openai.com/): Базовая языковая модель.
- Claude: Языковая модель от Anthropic.
- MacWhisper/SuperWhisper: Инструменты для локальной транскрипции.
- Mistral (https://chat.mistral.ai/chat): Языковая модель с Canvas.
- Recraft (https://recraft.ai/): Генератор презентаций с AI.
- Elicit (https://elicit.com/): Инструмент для рисерча.
- Opticull: Инструмент для работы с фотографиями.
- Poe (https://poe.com/): Агрегатор языковых моделей.
- Yandex.Kit: Сервис от Яндекса для распознавания речи.
- WhisperTranscribe (https://www.whispertranscribe.com/download): Инструмент для транскрипции на основе Whisper.
- Obsidian MD Helper: Плагин для Obsidian с интеграцией AI.