Преобразование голоса в текст. Фильтрация высоких частот
Ну вот, наконец-то это свершилось!
Доделал я всё же блок фильтрации высоких частот.
Как видно на рисунке, жёлтая огибающая - это высокая частота (около 4 Кгц), а серая линия - это то, что получилось после убирания ВЧ из сигнала. Осталась только НЧ-составляющая.
Вернее, остались частоты ниже вырезанной. То есть, удалились только выше указанной, а те, что ниже - остались. То есть, нужно ещё раз протащить полученный сигнал через фильтр, потом ещё раз и так до тех пор, пока не очистится окончательно...
Доделал я всё же блок фильтрации высоких частот.
Как видно на рисунке, жёлтая огибающая - это высокая частота (около 4 Кгц), а серая линия - это то, что получилось после убирания ВЧ из сигнала. Осталась только НЧ-составляющая.
Вернее, остались частоты ниже вырезанной. То есть, удалились только выше указанной, а те, что ниже - остались. То есть, нужно ещё раз протащить полученный сигнал через фильтр, потом ещё раз и так до тех пор, пока не очистится окончательно...
01. Фильтрация высоких частот, 683*323,4 Kb
Comments (14):
сначала убираются частоты выше указанной, но та основа, относительно которой они колебались, остаются. поэтому нужно второй раз запустить алгоритм и убрать эти частоты и т.д.
но для преобразования он достаточен.
:o)
Я в том смысле, что аудио волна-то не должна быть идеально прямой, и вообще она не хило должна колебаться, чтобы нести информацию. Тоесть: в итоге (после преобразования) серая линия НЕ БУДЕТ ПРЯМОЙ, ТАК?
//пардон за тупые вопросы..
ты что??
я ж выше написал, что делает этот блок очистки.
допустим, в сигнале есть частоты 1,2,3,4,5 Кгц.
сначала он уберёт частоты 5 Кгц и выше. но все остальные останутся. потом нужно пропустить через алгоритм ещё раз с параметром убрать выше 4 Кгц. но 3 Кгц останутся. и т.п.
я слишком утрировал, но примерно так :) понятно?
Думаешь, после того, как отфильтруешь на экране увидишь Текст ?
Не задумывался как ухо устроено? ухо содержит набор резонаторов от с которыми связанны рецепторы, Если переводить на технический язык то это спектральный анализ.
И высокие частоты тоже имеют информационную состовлящую, у нас тоже хватает шипящих звуков. И подавив высокие, ты не сможешь их устойчиво выделить.
Нужно прежде всего 1.спектральный анализ(БПФ,или что нибудь вроде него)Далее распознавание образов, Далее смысловой анализ. Теоретически это все лет 20 назад, а то и более, но пока туго все идет. Думаю клинит, в адапативном алгоритме анализа.
Занимал меня этот вопрос, почему не сделуют голос в текст, раньше))
Дерзай.
а ещё будет дальше и ещё. и ещё , и ещё! :)
насчёт спектров ты прав. это тупик.
А насчет тупика со спектором, я вроде не говорил:)) Без него не обойтись, принципиально.
Может я конешно и ошибаюсь. Проблема и туман на следущем этапе.
А по поводу фильтров, попробуй различить на слух, что говорят, после узкополосного фильтра. Или хотябы поиграйся эквалайзером при прослушивание текста, все услышишь сам:))
я уже давно всё обдумал и поезд уже не остановить.
только вперёд!
мне тоже хочется чтобы у тебя все вышло:)
Но любая идея требует скурпулезной проработки и постоянной корекции по мере воплощения. Если ты даже все обдумал это не значит, что нужно отбросить весь опыт накопленный в данном направление. Это просто сократит время на достижение цели.
А если не хочешь обсуждать свою задумку это твое личное дело.
Но в любом случае меня радует твой оптимзм :))