Spaces:

Vgjkmhf
/

cctvoi

Runtime error

App Files Files Community

Vgjkmhf commited on 12 days ago

Commit

d0c0da1

verified ·

1 Parent(s): 65b7903

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -46

app.py CHANGED Viewed

@@ -5,85 +5,97 @@ import gradio as gr
 from rvc_python.infer import RVCInference
 import static_ffmpeg
-# تنظیمات اولیه ffmpeg
 static_ffmpeg.add_paths()
 ffmpeg_path = imageio_ffmpeg.get_ffmpeg_exe()
 os.environ["PATH"] += os.pathsep + os.path.dirname(ffmpeg_path)
-def rvc_process(audio_path, model_file, index_file, pitch_change, f0_method):
-    # بررسی ورودی‌ها
-    if not audio_path:
-        return None, "⚠️ خطا: لطفاً فایل صوتی را آپلود یا ضبط کنید."
-    if not model_file:
-        return None, "⚠️ خطا: لطفاً فایل مدل (.pth) را آپلود کنید."
     try:
-        # گرفتن مسیر فایل‌ها
         model_path = model_file.name
         index_path = index_file.name if index_file else None
-        print(f"Loading model: {model_path}")
-        # اجرای RVC روی CPU
         rvc = RVCInference(device="cpu")
         rvc.load_model(model_path)
-        out_path = "/tmp/output_rvc.wav"
         if os.path.exists(out_path): os.remove(out_path)
-        # تشخیص هوشمند پارامترهای تابع (چون در نسخه‌های مختلف فرق دارد)
         sig = inspect.signature(rvc.infer_file)
-        kwargs = {"input_path": audio_path, "output_path": out_path}
-        # تنظیم پارامتر Pitch
-        if "pitch" in sig.parameters: kwargs["pitch"] = int(pitch_change)
-        elif "f0_up_key" in sig.parameters: kwargs["f0_up_key"] = int(pitch_change)
-        # تنظیم پارامتر Method
-        if "method" in sig.parameters: kwargs["method"] = f0_method
-        elif "f0_method" in sig.parameters: kwargs["f0_method"] = f0_method
-        # تنظیم پارامتر Index
-        if "index_path" in sig.parameters: kwargs["index_path"] = index_path
-        print(f"Processing with params: {kwargs}")
         rvc.infer_file(**kwargs)
-        return out_path, "✅ تبدیل با موفقیت انجام شد!"
     except Exception as e:
         return None, f"❌ خطا: {str(e)}"
-# طراحی رابط کاربری
-with gr.Blocks(title="RVC WebUI", theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 🎵 RVC Voice Converter (CPU)")
-    gr.Markdown("فایل‌های مدل (.pth) و ایندکس (.index) خود را آپلود کنید و صدای خود را تغییر دهید.")
     with gr.Row():
-        # ستون ورودی‌ها
         with gr.Column():
-            gr.Markdown("### 1. ورودی‌ها")
-            audio_input = gr.Audio(label="🎤 صدای ورودی (ضبط یا آپلود)", type="filepath")
-            model_input = gr.File(label="🤖 فایل مدل (.pth)", file_types=[".pth"], file_count="single")
-            index_input = gr.File(label="📂 فایل ایندکس (.index) - اختیاری", file_types=[".index"], file_count="single")
-            gr.Markdown("### 2. تنظیمات")
-            pitch_slider = gr.Slider(minimum=-12, maximum=12, value=0, step=1, label="🎵 تغییر گام (Pitch)", info="مرد به زن: +12 | زن به مرد: -12")
-            method_drop = gr.Dropdown(choices=["rmvpe", "pm"], value="rmvpe", label="⚙️ الگوریتم پردازش")
-            convert_btn = gr.Button("🚀 شروع تبدیل صدا", variant="primary")
-        # ستون خروجی
-        with gr.Column():
-            gr.Markdown("### 3. خروجی")
-            audio_output = gr.Audio(label="🎧 صدای نهایی")
-            status_output = gr.Textbox(label="وضعیت عملیات", lines=2)
-    # اتصال دکمه به تابع
-    convert_btn.click(
-        fn=rvc_process,
-        inputs=[audio_input, model_input, index_input, pitch_slider, method_drop],
-        outputs=[audio_output, status_output]
     )
 if __name__ == "__main__":

 from rvc_python.infer import RVCInference
 import static_ffmpeg
+# تنظیمات سیستمی و FFmpeg
 static_ffmpeg.add_paths()
 ffmpeg_path = imageio_ffmpeg.get_ffmpeg_exe()
 os.environ["PATH"] += os.pathsep + os.path.dirname(ffmpeg_path)
+def rvc_process(audio_path, model_file, index_file, pitch_change, f0_method, index_rate, protect_val, filter_radius):
+    if not audio_path or not model_file:
+        return None, "⚠️ فایل‌ها کامل نیستند."
     try:
         model_path = model_file.name
         index_path = index_file.name if index_file else None
+        print(f"Processing Model: {model_path}")
         rvc = RVCInference(device="cpu")
         rvc.load_model(model_path)
+        out_path = "/tmp/output_persian_fix.wav"
         if os.path.exists(out_path): os.remove(out_path)
+        # کشف پارامترهای تابع (برای سازگاری با نسخه‌های مختلف)
         sig = inspect.signature(rvc.infer_file)
+        params = sig.parameters
+        kwargs = {
+            "input_path": audio_path,
+            "output_path": out_path,
+        }
+        # 1. پیچ (Pitch)
+        if "pitch" in params: kwargs["pitch"] = int(pitch_change)
+        elif "f0_up_key" in params: kwargs["f0_up_key"] = int(pitch_change)
+        # 2. متد (Method) - حتما RMVPE
+        if "method" in params: kwargs["method"] = f0_method
+        elif "f0_method" in params: kwargs["f0_method"] = f0_method
+        # 3. ایندکس (Index)
+        if "index_path" in params: kwargs["index_path"] = index_path
+        if "index_rate" in params: kwargs["index_rate"] = float(index_rate)
+        # 4. محافظت (Protect) - حیاتی برای فارسی
+        if "protect" in params: kwargs["protect"] = float(protect_val)
+        # 5. فیلتر (Filter Radius) - برای رفع لرزش صدا
+        if "filter_radius" in params: kwargs["filter_radius"] = int(filter_radius)
+        # 6. دقت زمانی (Hop Length) - برای کیفیت بهتر
+        if "hop_length" in params: kwargs["hop_length"] = 64  # دقت بالاتر (پیشفرض 128 است)
+        print(f"Running with: {kwargs}")
         rvc.infer_file(**kwargs)
+        return out_path, "✅ تبدیل انجام شد (تنظیمات فارسی اعمال شد)"
     except Exception as e:
         return None, f"❌ خطا: {str(e)}"
+# رابط کاربری پیشرفته فارسی
+with gr.Blocks(title="Persian RVC", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🇮🇷 مبدل صدای RVC (بهینه برای فارسی)")
+    gr.Markdown("این نسخه برای رفع مشکل خش‌دار بودن صدا و تداخل لهجه تنظیم شده است.")
     with gr.Row():
         with gr.Column():
+            gr.Markdown("### 1. فایل‌های ورودی")
+            audio_in = gr.Audio(label="صدای ورودی (واضح و بدون نویز)", type="filepath")
+            model_in = gr.File(label="فایل مدل (.pth)", file_types=[".pth"])
+            index_in = gr.File(label="فایل ایندکس (.index)", file_types=[".index"])
+        with gr.Column():
+            gr.Markdown("### 2. تنظیمات حیاتی")
+            pitch = gr.Slider(-12, 12, value=0, step=1, label="تغییر گام (Pitch)", info="مرد به زن: +12 | زن به مرد: -12")
+            method = gr.Dropdown(["rmvpe", "pm"], value="rmvpe", label="الگوریتم", info="فقط RMVPE کیفیت مناسب دارد.")
+            gr.Markdown("### 3. تنظیمات رفع خش و تداخل")
+            index_rate = gr.Slider(0, 1, value=0.3, step=0.05, label="شدت ایندکس (Index Rate)", info="پیشنهاد فارسی: 0.3 تا 0.4 (کمتر = تداخل کمتر)")
+            protect = gr.Slider(0, 0.5, value=0.5, step=0.01, label="محافظت (Protect)", info="پیشنهاد فارسی: 0.5 (حداکثر) برای جلوگیری از خش‌دار شدن")
+            filter_radius = gr.Slider(0, 7, value=3, step=1, label="فیلتر نرم‌کننده (Filter Radius)", info="برای حذف لرزش‌های اضافه (پیشنهاد: 3)")
+            btn = gr.Button("✨ شروع پردازش", variant="primary")
+    with gr.Row():
+        audio_out = gr.Audio(label="خروجی نهایی")
+        status = gr.Textbox(label="پیام سیستم")
+    btn.click(
+        rvc_process,
+        [audio_in, model_in, index_in, pitch, method, index_rate, protect, filter_radius],
+        [audio_out, status]
     )
 if __name__ == "__main__":