[Windows|MacOS] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic] [Повтор-1]

[Windows|MacOS] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic][Повтор-1]
Ваш Персональный Командный Центр с поддержкой MCP
Предыдущий

История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня…

Screenshot_2026_03_15-11.jpg
У вас тоже есть эта папка? "Разобрать позже"?

Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.

Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.

А теперь представьте другую реальность.
Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.

Вы можете получить великолепного качества перевод, субтитры, красиво форматированный конспект, или даже отслеживать указать папки для авто-отслеживания…

Whisper Voice Machine (WVM)
Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.

Почему я перестал печатать (владея слепой печатью 16 лет)?

Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать — это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace — идея ускользает или мутирует.

Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.

Три режима использования
Узнайте себя в одном из них

  1. Для "Коллекционеров Знаний" (Складчиков)
    Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
    Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
    Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод. Или еще проще. Просто скажите программе отслеживать определенные папки на вашем компьютере и обрабатывать новое автоматически! (NEW! Включая скриншоты)
    Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.
  2. Для SMM, Копирайтеров и Креаторов
    Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
    Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
    Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
    Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента. (NEW! Включая работу с картинками и фотографиями!)
  3. Для Управленцев и Менеджеров
    Вас бесят бесконечные переписки и созвоны, но вы обязаны соблюдать корпоративный этикет?
    Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
    Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной. Или доставайте информацию из длинных созвонов за считанные минуты!

Ваш технологический арсенал

Спойлер: Раскрыть возможности программы 1. Тотальный отказ от ручной печати
Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор — туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль через разные промпты пост-обработки текста!

2. "Пожиратель Курсов": Видео в Текст + Перевод
Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переводчик". Вы получите готовую методичку на родном языке. NEW! Вы можете получить идеально синхронизированные по таймингам таймкоды на родном языке!

3. Model Content Protocol (MCP Server)
Технология будущего, доступная сегодня.

WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
Вы можете попросить Claude Desktop (или Open Code Desktop, или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."

А может быть вы хотите получить обзор большого видео-курса, агент соберет его для вас, просмотрев все расшифровки, и даже выдернет нужные кадры из видео-материалов (Извлечение кадров — в ближайших планах!)

4. Умный поиск и База Знаний
Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется. Ни один скриншот, аудио, или видео не будут лежать мёртвым грузом на диске!

Окно поиска: Ваша база знаний всегда под рукой

Настройки AI: Полная свобода в выборе моделей и промтов​
Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.

1) Распознавание (Уши) — 100% локально
Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.

Базовый вариант (без постобработки):
Вы можете выключить постобработку и работать почти что на любом современном компьютере.
Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
Это самый доступный режим.

2) Постобработка (Мозги) — на ваш выбор

  • Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
    Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
    Пример: OpenRouter (Gemini Flash, DeepSeek и др.), сейчас поддерживается так же один из РФ посредников, без конских наценок. Оплата за рубли и СБП.
    Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.
  • Вариант №3 — локальная постобработка (тотальная приватность)
    Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
    Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
    Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
    Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.

    Из протестированных мной моделей отлично себя показывают:
    Qwen 3, 3.5 (4B и 8B), Gemma 3 (разные размеры).
    Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.
    Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
    Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.

Системные требования (3 уровня)

1) Минимальные (базовый режим: только распознавание)
Для кого:
если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).

  • CPU: Intel Core от 4-го поколения (у меня работает на таком железе).
  • ОЗУ: 8 ГБ.
  • GPU: не обязателен (можно на CPU, просто будет медленнее).

Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.

2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
Для кого:
если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).

  • CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).
  • ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).
  • GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)
  • Интернет: нужен только для постобработки (распознавание всё равно локальное).

Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.

3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
Для кого:
если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.

  • ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).
  • GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).
  • CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.

Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.

Почему lifetimeI, а не подписка?

Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:

  • Пожизненную лицензию (Lifetime) на 3 ваших компьютера.
  • Пакет «Системных промтов» (SMM, деловой стиль, кодинг).
  • Прямую поддержку от автора в этой теме.
  • Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.

Важно по-честному про обновления и поддержку:
Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
На международном рынке LifeTime лицензия будет стоить вдвое дороже.
Код будет защищен через обфускацию. Привязка к железу. HDD (если не подошел) -> MAC сетевой карты.
У нас бывают случаи когда ни то ни другое не подхододит. Решается в индивидуальном порядке, но это редкость.

Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))

Поддерживается Windows 11, Windows 10, Mac OS Tahoe (Чипы Apple M1 +++)

Не поддерживается:
— Серверные Windows
— Windows 7 (Я вообще без понятия кто им пользуется в 2026м)
— Linux (В теории можно но не тестировал) — будет в будущем…

Хватит печатать и копить информацию. Начните управлять ею.

Специальный бонус за рекламу
Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов

Внутри бонуса набор:

"Telegram-Машина" — посты из бубнежа.
"Корректор" — исправление ошибок с сохранением стиля.
"Деловая Акула" — жесткие юридические письма.
"Кодер" — оформление алгоритмов в чистый код.

Отзывы

Записывайтесь. В следующем повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.

Все экраны приложения.

Свежие скрины приложения
и немного устаревшие демо видео (будут свежие позже)