Реалізація AI-шумопридушення в аудіо AI-шумопридушення прибирає фонові шуми (HVAC, трафік, клавіатура, гул) з мовних записів. На відміну від спектрального віднімання, нейромережевые моделі не створюють «музичного шуму» і зберігають природність голосу. ### Інструменти та підходи noisereduce — бібліотека на основі спектрального віднімання з адаптивним профілем шуму:```python
import noisereduce as nr import soundfile as sf import numpy as np
def denoise_audio(input_path: str, output_path: str) -> None: audio, sr = sf.read(input_path)
# Статистика шума из первых 0.5 секунд (тишина/фон)
noise_sample = audio[:int(sr * 0.5)]
reduced = nr.reduce_noise(
y=audio,
sr=sr,
y_noise=noise_sample,
prop_decrease=0.75, # степень подавления: 0=нет, 1=максимум
stationary=False # False = адаптивный шум
)
sf.write(output_path, reduced, sr)
**RNNoise** - легковажна рекурентна мережа від Mozilla, працює в реальному часі:python
import subprocess
def rnnoise_denoise(input_wav: str, output_wav: str) -> None:
# Требует 48 kHz моно
subprocess.run([
"ffmpeg", "-i", input_wav,
"-af", "arnndn=m=/usr/share/rnnoise/rnnoise-models/beguiling-drafter-2018-08-30/bd.rnnn",
output_wav
], check=True)
**DeepFilterNet** — SOTA модель для покращення мови, DNSMos > 3.8/5:python
from df import enhance, init_df
model, df_state, _ = init_df()
def deepfilter_enhance(audio_array: np.ndarray, sr: int) -> np.ndarray: enhanced = enhance(model, df_state, audio_array) return enhanced







