После каждого созвона повторяется один и тот же ритуал. Ты ставишь запись, отматываешь, выписываешь, кто что обещал, к какому сроку, какие решения приняли. На часовую встречу уходит ещё полчаса разбора. А если встреч несколько в день, протоколы либо пишутся наспех, либо не пишутся вообще - и задачи теряются между “вроде договорились” и “а кто это должен был сделать?”.
Просить ИИ-ассистента “сделай протокол из записи” в лоб тоже не выходит. Расшифровать аудио, потом разобрать длинный транскрипт на саммари, решения и задачи, потом собрать всё в аккуратный документ - это не одно действие, а несколько разных. В один заход и в один скрипт такая задача не помещается.
И отдельная боль: запись встречи - это чужие голоса, имена, иногда коммерческая тайна. Заливать такое в облачный сервис расшифровки - значит нарушить NDA или закон о персональных данных. Хочется, чтобы всё считалось у тебя на машине и никуда не утекало.
В чём идея
Когда задача не лезет в один шаг - её разбивают на цепочку. Это и есть пайплайн: несколько инструментов выстроены в линию, и выход одного шага становится входом следующего. Для протокола встречи цепочка короткая и понятная: аудио превращается в текст, текст - в структуру (саммари, решения, задачи), структура - в готовый протокол.
Скил здесь не “одна команда”, а композиция. Каждый шаг отвечает строго за своё: первый расшифровывает, второй разбирает, третий собирает. Они не лезут в чужую зону и общаются только результатами - как эстафета. Из-за этого вся конструкция управляемая: понятно, где что происходит, и легко поправить один кусок, не трогая остальное.
Почему так удобнее, чем “сделай мне всё сразу”? Большую задачу модель тянет плохо: на длинном тексте она путается и теряет детали. А маленький шаг с одной ответственностью - делает чисто. Плюс промежуточный результат можно сохранить: если протокол вышел неточным, перезапускаешь только разбор, а тяжёлую расшифровку заново не гоняешь. Это экономит и время, и нервы.
Второй принцип - приватность по умолчанию. Расшифровка идёт локальной моделью прямо на твоей машине: само аудио наружу не уходит. Важная честная оговорка: текст транскрипта на шаге разбора по умолчанию уходит в облачную модель ассистента (Claude Code, Codex, Cursor). Для большинства встреч это нормально, но если в записи NDA или персональные данные - попроси ассистента и разбор транскрипта делать локальной моделью, тогда наружу не уйдёт вообще ничего.
И, как всегда со скилами, скил говорит, ЧТО сделать на каждом шаге, а ЧЕМ именно расшифровать (какой локальный движок, на процессоре или на видеокарте) - решает сам ассистент по тому, что есть у тебя в системе.
Как себе сделать
Не собирай пайплайн руками. Отдай задачу своему ассистенту - Claude Code, Codex, Cursor, любому. Он сам выстроит цепочку и решит, чем расшифровать локально. Одна оговорка: для расшифровки на машине нужен локальный движок распознавания речи (Whisper, faster-whisper или аналог) - если его ещё нет, ассистент подскажет, как поставить, когда получит задачу. Просто скопируй промпт:
Создай мне скил, который из записи встречи делает протокол с задачами, и работает локально - аудио наружу не отправляй.
Это пайплайн из шагов, где выход одного шага становится входом следующего:
1) аудио в текст: расшифруй файл встречи локальной моделью распознавания речи (Whisper, faster-whisper или аналог), русский язык; если локального движка в системе нет - сначала подскажи, как его поставить, и только потом продолжай;
2) текст в структуру: по транскрипту выдели короткое саммари, принятые решения и список задач - что сделать, кто ответственный, к какому сроку;
3) структуру в протокол: собери аккуратный протокол с датой, решениями и таблицей задач, сохрани его рядом с записью и покажи сводку - сколько решений и задач вышло.
Имена и сроки бери только из текста, не выдумывай: чего нет в записи - помечай "не задан".
Промежуточный транскрипт сохрани, чтобы при правке не расшифровывать заново.
Срабатывай на просьбы вроде "расшифруй встречу", "сделай протокол созвона", "вытащи задачи из записи".
Как понять, что заработало: кинь ассистенту короткую запись и напиши “сделай протокол”. Если он сам прогонит цепочку и вернёт саммари, решения и задачи с ответственными - пайплайн собран и живой. Дальше любая встреча - теми же словами.
И всё. Ты только что собрал не одну команду, а цепочку из нескольких - и ни строчки кода руками. Так же раскладывается на шаги любая большая рутина: расшифровка и разбор, выгрузка и сводка, сбор и рассылка. Один раз описал цепочку - дальше ассистент гоняет её сам.
Смотреть полностью
- YouTube: https://www.youtube.com/watch?v=aRTtF2M3T3o
- VK Видео: https://vk.com/video-233222565_456239057
- Rutube: https://rutube.ru/video/99f26f34e1453963676d210b5fa62eeb/
Коротко
- YouTube Shorts: https://www.youtube.com/shorts/1-T2Ux7uX68
- VK Клипы: https://vk.com/clip-233222565_456239058
- Rutube: https://rutube.ru/video/e634121bd6e5e8d397b9aaab6e57f1c0/
- Telegram: https://t.me/chernovdev/2134
