Spaces:

wedyanessam
/

Real_Time_Interactive_Avatar_v2

Runtime error

App Files Files Community

wedyanessam commited on May 28, 2025

Commit

da8f7f9

verified ·

1 Parent(s): 8f33c2c

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -13

app.py CHANGED Viewed

@@ -4,26 +4,26 @@ import sys
 from pathlib import Path
 import argparse
 import gradio as gr
-# شغّلي السكربت إذا ما اشتغل قبل كذا
-if not os.path.exists("./fantasy/fantasytalking_model.ckpt"):
-    print("🛠️ جاري تحميل الملفات عبر setup.sh ...")
-    subprocess.run(["bash", "setup.sh"])
-# إعداد المسارات
 sys.path.append(os.path.abspath("."))
-# استيراد الباقي
 from STT.sst import speech_to_text
 from LLM.llm import generate_reply
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
-# ثابتات النموذج بدون Wan
 args_template = argparse.Namespace(
-    fantasytalking_model_path="./fantasy/fantasytalking_model.ckpt",
-    wav2vec_model_dir="./wav2vec",
     image_path="",
     audio_path="",
     prompt="",
@@ -39,11 +39,12 @@ args_template = argparse.Namespace(
     seed=1111
 )
-# تحميل النماذج (بدون Wan)
 print("🚀 جاري تحميل FantasyTalking و Wav2Vec...")
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
     args = argparse.Namespace(
         **vars(args_template),
@@ -54,6 +55,7 @@ def generate_video(image_path, audio_path, prompt, output_dir="./output"):
     )
     return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
 def full_pipeline(user_audio, user_image):
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
@@ -74,7 +76,7 @@ def full_pipeline(user_audio, user_image):
     return user_text, reply, reply_audio_path, video_path
-# واجهة Gradio
 with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
     gr.Markdown("## 🎤➡️💬➡️🔊➡️📽️ من صوتك إلى فيديو متكلم!")
@@ -95,4 +97,3 @@ with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)

 from pathlib import Path
 import argparse
 import gradio as gr
+# ✅ تشغيل سكربت تحميل الموديلات إذا الموديلات مو موجودة
+if not os.path.exists("./models/fantasytalking_model.ckpt"):
+    print("🛠️ جاري تحميل النماذج عبر download_models.py ...")
+    subprocess.run(["python", "download_models.py"])
+# ✅ إعداد المسارات للمشروع
 sys.path.append(os.path.abspath("."))
+# ✅ استيراد المكونات
 from STT.sst import speech_to_text
 from LLM.llm import generate_reply
 from TTS_X.tts import generate_voice
 from FantasyTalking.infer import load_models, main
+# ✅ ثابتات النموذج (بالمسارات الجديدة)
 args_template = argparse.Namespace(
+    fantasytalking_model_path="./models/fantasytalking_model.ckpt",
+    wav2vec_model_dir="./models/wav2vec2-base-960h",
+    wan_model_dir="./models/Wan2.1-I2V-14B-720P",  # لو رجعتي تستخدمي Wan
     image_path="",
     audio_path="",
     prompt="",
     seed=1111
 )
+# ✅ تحميل النماذج
 print("🚀 جاري تحميل FantasyTalking و Wav2Vec...")
 pipe, fantasytalking, wav2vec_processor, wav2vec = load_models(args_template)
 print("✅ تم التحميل!")
+# ✅ دالة توليد الفيديو
 def generate_video(image_path, audio_path, prompt, output_dir="./output"):
     args = argparse.Namespace(
         **vars(args_template),
     )
     return main(args, pipe, fantasytalking, wav2vec_processor, wav2vec)
+# ✅ دالة خط الأنابيب الكامل
 def full_pipeline(user_audio, user_image):
     print("🎤 تحويل الصوت إلى نص...")
     user_text = speech_to_text(user_audio)
     return user_text, reply, reply_audio_path, video_path
+# ✅ واجهة Gradio
 with gr.Blocks(title="🧠 صوتك يحرك صورة!") as demo:
     gr.Markdown("## 🎤➡️💬➡️🔊➡️📽️ من صوتك إلى فيديو متكلم!")
               outputs=[user_text, reply_text, reply_audio, video_output])
 demo.launch(inbrowser=True, share=True)