LipsyncX
Hugging Face Space แบบฝัง

เดโมตัวสร้างวิดีโอ NAVA AI

สำรวจเวิร์กโฟลว์สร้างเสียงและวิดีโอแบบ native ของ NAVA จากหน้า LipsyncX เดโมนี้รันใน Hugging Face Space สาธารณะ ดังนั้นความพร้อมใช้งานและเวลารอคิวขึ้นอยู่กับ Space นั้น

หน้านี้ฝัง Hugging Face Space ของบุคคลที่สามซึ่งไม่ได้ดูแลโดย LipsyncX โปรดใช้เฉพาะรูปภาพ เสียง และ prompt ที่ได้รับความยินยอมแล้ว

เดโมเสียง-วิดีโอ NAVA นี้สร้างอะไรได้บ้าง

NAVA ออกแบบมาสำหรับการทดลองวิดีโอและเสียงสั้นที่ซิงก์กัน รวมถึงฉากพูดและการออกแบบเสียงแบบภาพยนตร์

จาก prompt เป็นเสียง-วิดีโอ

เริ่มจาก prompt ข้อความแล้วสร้างคลิปสั้นที่มีการเคลื่อนไหวพร้อมเสียงที่สอดคล้องกัน

เสียงพูดและบรรยากาศพร้อมกัน

ทดสอบ prompt ที่มีบทพูด เสียงสภาพแวดล้อม และสัญญาณเสียงที่ต้องตรงเวลา

ทดลองด้วยสื่ออ้างอิง

เมื่อ Space รองรับ ให้ลองใช้ภาพเฟรมแรกหรือเสียงอ้างอิงสำหรับการทดสอบแบบควบคุม

วิธีใช้เครื่องมือ Hugging Face แบบฝัง

iframe โหลด Gradio Space สาธารณะโดยตรง ดังนั้นเวิร์กโฟลว์จะเป็นไปตาม control ที่ Space นั้นเปิดให้ใช้

1

เขียนหรือเขียน prompt ใหม่

เริ่มด้วยฉาก การเคลื่อนไหว บทพูด และทิศทางเสียงที่ชัดเจน ตัวเลือก rewrite สามารถขยาย prompt สั้นให้เป็นคำบรรยายภาษาจีนแบบละเอียดที่ NAVA ต้องการ

2

เลือกอินพุตและการตั้งค่า

เลือกอัตราส่วนภาพ ภาพหรือเสียงอ้างอิงเสริม และการตั้งค่าการสร้างภายในแอปที่ฝังไว้

3

รอคิวของ Space

การสร้างใช้ฮาร์ดแวร์ของ Hugging Face Space หากคิวแน่นหรือ Space หลับ ให้เปิดลิงก์ภายนอกแล้วลองใหม่ภายหลัง

ข้อควรรู้ก่อนสร้าง

NAVA เป็นเดโมโมเดลเชิงวิจัย ไม่ใช่ backend render ที่ LipsyncX โฮสต์

การสร้างอาจช้า ใช้งานไม่ได้ หรือถูกจำกัดตามความจุของ Hugging Face Space

อย่าอัปโหลดรูปภาพหรือเสียงของบุคคลจริงโดยไม่มีความยินยอมและสิทธิ์ในการใช้งาน

ควรใช้ NAVA กับ LipsyncX เมื่อใด

ใช้เดโมนี้เพื่อการวิจัยและหาแรงบันดาลใจ สำหรับงาน lip sync ระดับ production, preview เร็ว, ยอดบัญชี และ output ที่ดาวน์โหลดได้ ให้ใช้ LipsyncX Studio

FAQ ตัวสร้างวิดีโอ NAVA AI

ใช้ NAVA บน Hugging Face โดยตรงได้ไหม?

คุณลองใช้ Space สาธารณะได้เมื่อพร้อมใช้งาน แต่ NAVA ยังไม่ได้ deploy เป็น Hugging Face Inference Provider API ที่เสถียร

เครื่องมือฝังนี้โฮสต์โดย LipsyncX หรือไม่?

ไม่ใช่ iframe โหลด Hugging Face Space ของบุคคลที่สาม ดังนั้น uptime, คิว และการเปลี่ยนโมเดลอยู่ภายใต้ Space นั้น

prompt แบบไหนเหมาะกับ NAVA ที่สุด?

prompt ภาษาจีนที่ละเอียดและอธิบายการเคลื่อนไหว กล้อง บทพูด และเสียงอย่างชัดเจนมักทำงานดีกว่า prompt ภาษาอังกฤษสั้นมาก

ใช้ output เชิงพาณิชย์ได้ไหม?

ก่อนใช้เชิงพาณิชย์ โปรดตรวจสอบ license ของโมเดล NAVA เงื่อนไขของ Space และสิทธิ์ในสื่อต้นทาง