複製YouTube上最賺錢的頻道?實測用AI打造被動收入!影片製作流程完整公開!哈佛姐夢遊矽谷
三句話摘要
用 ChatGPT、Google Flow、ElevenLabs、DomoAI 四工具串接,零露臉製作中文兒童 YouTube 影片的完整實測流程。 中文兒童 YouTube 是低競爭、高回報的藍海,而 ChatGPT + Google Flow + ElevenLabs + DomoAI 的四工具串接,已讓個人零技術背景入場成為現實。 中文兒童頻道是相對藍海。 台灣前幾大 YouTube 頻道以成人內容為主,兒童頻道稀少;對比英語市場 Cocomelon 的驚人收益,中文市場存在明顯供需缺口,進入時機相對有利。
重點整理
重點- 1
中文兒童頻道是相對藍海。 台灣前幾大 YouTube 頻道以成人內容為主,兒童頻道稀少;對比英語市場 Cocomelon 的驚人收益,中文市場存在明顯供需缺口,進入時機相對有利。
- 2
AI 工具鏈讓製作門檻大幅下降。 過去做兒童動畫需要角色設計、配音演員、動畫製作與穩定更新能力,現在透過四個工具的流水線,任何人都可以在無技術背景的情況下產出可上架的高品質影片。
- 3
Prompt 工程與角色一致性是品質關鍵。 講者將台灣元素(便利商店、思樂冰、拍貼機、電子雞)、角色外觀細節(短髮齊瀏海、紅白條紋褲)全部寫入 Prompt,並利用 Google Flow 的 Reference 圖功能確保角色跨場景一致,避免 AI 幻覺造成角色跑版。
- 4
DomoAI 的多功能性可延伸為被動收入來源。 除了 Talking Avatar,DomoAI 還能做 Image to Video B-Roll 補拍、老照片修復與解析度提升,而後者在 Fiverr/Upwork 上有人收費 5 美金以上一張,是另一個潛在的接案收入管道。
實用技巧與重點
乾貨- Cocomelon 單月 Monthly Estimated Earning:500 萬美金(5 million USD)
- Cocomelon 全球訂閱數:2 億(200 million subscribers)
- 使用工具:ChatGPT(腳本生成)、Google Flow(Text to Image)、ElevenLabs(Text to Speech 童聲配音)、DomoAI(Talking Avatar、Image to Video、圖片修復)
- Google Flow 模型選擇:Nano Banana Pro
- 影片比例:16:9(YouTube 格式)
- DomoAI Talking Avatar 影片長度設定:音檔 7 秒 → 輸出選 10 秒
- 腳本場景數:總共 7 個不同場景
- 台灣元素 Prompt 關鍵詞:便利商店、思樂冰(Slurpee)、電子雞、文具店、拍貼機
- 角色設定來源:將講者兒時照片餵給 GPT,由 AI 生成角色描述
- 角色規格:短髮齊瀏海、紅白條紋褲、紅色運動鞋、無眼鏡
- 影片串接工具:QuickTime(Mac 內建,Add Clip to the End 功能)
- 外包平台收費參考:Fiverr/Upwork 照片修復約 5 美金以上/張
- Prompt 全文:講者提供於影片連結供免費下載
結論
結論“中文兒童 YouTube 是低競爭、高回報的藍海,而 ChatGPT + Google Flow + ElevenLabs + DomoAI 的四工具串接,已讓個人零技術背景入場成為現實。”
完整解析
詳細兒童 YouTube 頻道是全球流量最大、但被大多數內容創作者忽視的賽道。以英語頻道 Cocomelon 為例,其單月預估收入高達 500 萬美金,訂閱人數達 2 億,遠超大多數知名 YouTuber。講者 Alice 觀察到,台灣及中文市場的前幾大頻道幾乎清一色是成人創作者,兒童頻道的佔比極低,代表這個賽道在中文市場仍屬藍海。然而過去進入這個賽道的技術門檻極高,需要具備動畫製作、角色配音、腳本規劃與穩定更新等多項能力,一般個人創作者難以負擔。
AI 工具的普及改變了這個局面。Alice 在這支影片中完整示範了一條四工具串接的製作流水線:首先用 ChatGPT 生成分場景腳本,Prompt 中預先設定好角色外觀(短髮齊瀏海、紅白條紋褲)、台灣在地元素(7-11、思樂冰、拍貼機、電子雞)、視覺風格規則,以及 Text to Image 與 Image to Video 的提示詞格式,一次輸出涵蓋角色描述、各場景圖像提示詞、配音台詞在內的完整製作素材。角色的外觀設定靈感來自講者兒時的真實照片,將照片餵給 GPT 後由 AI 提煉出文字描述,賦予角色一種復古懷舊的台灣童年氣息。
有了腳本後,流程分三條線同步進行。圖像生成使用 Google Flow(Nano Banana Pro 模型),搭配 Reference 圖功能鎖定角色一致性,確保跨場景不跑版;配音則透過 ElevenLabs 的 Text to Speech 功能,選取童聲音色後輸入台詞,系統自動產出兩個版本供比較選用,滿意後下載音檔。最後將圖片與音檔同時上傳至 DomoAI 的 Talking Avatar 功能,再填入 Image to Video 提示詞(如「微風吹過黑髮、電影感光線」),設定長度為 10 秒、比例 16:9,即可生成角色真實說話的影片片段。七個場景全部完成後,用 Mac 內建的 QuickTime 透過「Add Clip to the End」功能逐段串接,一支完整的兒童影片就此誕生,全程不需露臉、不需找演員、不需任何動畫技術。
講者也補充了 DomoAI 的其他實用功能:Image to Video 可將靜態照片轉換為 B-Roll 素材,解決拍攝時忘記錄影的問題;老照片修復功能則能大幅提升解析度,而這項服務在 Fiverr 或 Upwork 等接案平台上,有人收費 5 美金以上一張,是一條潛在的被動收入管道。整體而言,這套 AI 流水線讓個人創作者得以快速複製影片、低成本實驗市場,大幅降低了進入兒童頻道賽道的風險與成本。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


