Ses-Analizi: Genre + AI Detection

Modüler bir ses analizi sistemi: tür (genre) tespiti, orijinal vs. AI karşılaştırması, ve HTML/PDF raporlama. FastAPI + CLI ile çalışır; özellik çıkarımı librosa/torchaudio tabanlıdır, modeller sklearn/LightGBM ile eğitilir.

Kurulum

python -m venv .venv
.venv\Scripts\activate  # Windows
pip install -r requirements.txt

Gerekli araçlar: ffmpeg (ses dönüştürme), optional GPU için PyTorch CUDA dağıtımı.

Dizim

ingestion/        # Yükleme + ön işleme
features/         # Özellik çıkarımı ve embeddingler
models/           # Genre + authenticity modelleri
comparator/       # İstatistiksel karşılaştırmalar
reporting/        # Plotly figürleri + HTML/PDF rapor
api/              # FastAPI servis girişi
cli/              # Komut satırı aracı
config/settings.yaml  # Ayarlar

Hızlı Başlangıç

CLI analiz: python -m cli.analyze path\to\audio.wav --model-dir models\artifacts --output-dir reports
API: uvicorn api.main:app --reload --port 8000 ardından POST /analyze ile dosya yükle.
API cevap şeması: genre listesi {label, confidence}, authenticity_score, features (özellik sözlüğü), report_path.

Eğitim (özet)

Veri yerleşimi: data/raw/{genre}/{ai|real}/*.wav.
Özellik çıkarımı: features.extractor.extract_all kullanarak DataFrame oluşturun (parquet/duckdb önerilir).
Tür modeli: models.trainer.train_genre_classifier(X, y_genre).
Authenticity modeli: models.trainer.train_authenticity_classifier(X, y_is_ai).
Modelleri kaydet: models/trainer.save_model(..., models/artifacts/genre_classifier.joblib) ve auth_classifier.joblib.

Otomasyon Betikleri

Özellik deposu: python data/build_features.py (girdi data/raw, çıktı data/processed/features.parquet).
Eğitim: python models/train.py (girdi data/processed/features.parquet, çıktı models/artifacts/*.joblib).
Değerlendirme: python models/evaluate.py (metrikler + HTML raporu reports/eval/).
Robustluk: python data/robustness.py (augmentasyonlarla genre/auth skor stabilitesi, sonuç reports/robustness.csv).
Veri doğrulama: python data/validate_dataset.py (per-genre AI/real sayıları, eksik klasörleri tespit).

Test

pytest ile temel birim testleri: pytest -q tests.

Önerilen Doğrulama

Değerlendirme: AUROC/accuracy + genre confusion matrix (heatmap), kalibrasyon eğrisi reports/eval/evaluation.html.
Robustluk: pitch/time-stretch/noise altında genre ve authenticity skor sapmalarını inceleyin (reports/robustness.csv).
Veri dengesi: per-genre AI/real dağılımını kontrol edin; gerekirse oversample/augment.

Konfig

config/settings.yaml üzerinden örnekleme oranı, mel/MFCC parametreleri, model tercihleri ve rapor çıktıları yönetilir. config.settings.get_settings() ile yüklenir.

Raporlama

reporting.report_builder.build_report metrik kartları ve Plotly görsellerini HTML olarak üretir; WeasyPrint varsa PDF de üretir. Çıktılar reports/ altına yazılır.

Tek parça raporunda yer alan görseller:

Mel-spectrogram (zaman-frekans)
Waveform ve energy envelope (RMS)
Spectral centroid zaman serisi
Chroma energy bar grafiği
Core feature bar (LUFS, RMS, flatness, H/P ratio, crest factor)

Notlar

Embedding için torchaudio paketleri (wav2vec2/hubert/mert) gerekir; yoksa hata mesajı döner.
PDF için weasyprint sistem bağımlılıkları (cairo, pango) isteyebilir.
Kod, prod öncesi kalibrasyon/robustluk testleri (pitch/time-stretch, mp3 sıkıştırma) yapılacak şekilde modüler tutuldu.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Ses-Analizi: Genre + AI Detection

Kurulum

Dizim

Hızlı Başlangıç

Eğitim (özet)

Otomasyon Betikleri

Test

Önerilen Doğrulama

Konfig

Raporlama

Notlar

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
api		api
cli		cli
comparator		comparator
config		config
data		data
features		features
ingestion		ingestion
models		models
reporting		reporting
tests		tests
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Rtur2003/music-analize

Folders and files

Latest commit

History

Repository files navigation

Ses-Analizi: Genre + AI Detection

Kurulum

Dizim

Hızlı Başlangıç

Eğitim (özet)

Otomasyon Betikleri

Test

Önerilen Doğrulama

Konfig

Raporlama

Notlar

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages