隱藏在 Gemini 深處的「Opal」革命
1. 緒論:從聊天機器人到應用程式構建者的典範轉移
1.1 生成式 AI 介面的演進與瓶頸
自大型語言模型(LLM)重回公眾視野以來,人機互動的主要介面一直被侷限於「聊天機器人」(Chatbot)的形式。這種線性的、基於文本的對話系統雖然在資訊檢索與創意寫作上表現出色,但其存在著與生俱來的缺陷:狀態管理的缺失、複雜任務編排的困難,以及可重複性的低落。用戶往往發現自己陷入了一個「無狀態」的互動迴圈中,必須不斷複製貼上提示詞(Prompt)來重現結果,而 AI 對於「過程」沒有永久的記憶,僅存對「對話」的記憶5。
Google 的 Gemini 生態系統正積極演進以解決這些限制。隨著 Gemini 1.0 和 1.5 的發布,帶來了巨大的上下文窗口(Context Window)和多模態能力,平台開始嘗試透過「Gems」——即自定義指令扮演的特定角色——來提供用戶定義的持久性。然而,Google Opal 的引入(最初作為 Google Labs 的獨立實驗,後於 2025 年底整合入 Gemini Web)標誌著一個關鍵的分歧點。Opal 將 Gemini 從一個被動的回應者,轉變為一個主動的工具「構建者」3。
1.2 揭開「Lab GEM」的面紗:什麼是 Google Opal?
Google Opal,在 Gemini 的介面上通常以「Gems made by Labs」或「Experimental Gems」的形式出現,是一個視覺化、基於節點(Node-based)的應用程式構建器。這不僅僅是聊天角色,而是由輸入、處理步驟和輸出構成的結構化軟體程序。
- 隱密而強大的入口: 正如資深 IT 部落客所觀察到的,這個功能非常隱密。用戶點擊這些實驗室 Gems 或啟動「New Gem」時,表面上看似普通的對話框,但實際上啟動了一個應用程式生成引擎。它能夠根據一句簡單的指令,如「建立一個分析股票趨勢並生成 YouTube 腳本的工具」,瞬間部署出包含網頁搜尋、數據綜合(Gemini)甚至影像生成(Imagen)的多步驟工作流2。
- 核心價值主張: Opal 的核心在於將自然語言轉化為可執行的軟體邏輯。它打破了傳統軟體開發中「需求」與「實作」之間的壁壘,讓「描述」即「構建」4。
1.3 「氛圍編碼」(Vibe Coding)的興起
業內開始使用「氛圍編碼」一詞來描述這種互動模式。這個概念由 Andrej Karpathy 等 AI 先驅推廣,指的是一種編程方式:用戶僅需用自然語言提供「氛圍」或高層次意圖(即「做什麼」),而由 AI 處理所有的實作細節(即「怎麼做」),包括語法、邏輯流和錯誤處理10。Google Opal 正是這一概念的旗艦級載體,它有效地將英語(或其他支援的語言)變成了最高階的程式語言,讓創意的邊界不再受限於程式碼的熟練度13。

2. Google Opal 的技術架構解構
要真正理解 Opal 為何被視為未來的利器,我們必須深入其底層架構。與標準的 LLM 互動不同,Opal 應用程式本質上是有向無環圖(DAGs),這賦予了它強大的邏輯處理能力。
2.1 節點式工作流引擎(Node-Based Workflow Engine)
每一個 Opal 應用程式的核心都是一個工作流編輯器,這通常隱藏在對話介面之後,但可以透過「進階編輯器」(Advanced Editor)訪問。這個編輯器將應用程式邏輯視覺化為一系列連接的節點或「步驟」。
| 節點類型 | 功能描述 | 技術意涵 |
| 輸入節點 (Input Nodes) | 定義終端用戶的數據入口。 | 不同於通用聊天框,Opal 可強制執行結構化輸入(如僅限圖片、僅限影片檔、或特定格式文本),確保下游模型接收正確的數據類型 |
| 生成節點 (Generate Nodes) | 包含處理邏輯的「大腦」。 | 利用 Google 基礎模型(如 Gemini 2.5 Pro)處理輸入。關鍵在於「鏈接」(Chaining):步驟 1 摘要文件,步驟 2 翻譯摘要,步驟 3 提取關鍵字。這種顯式的「思維鏈」(Chain of Thought)減少了模型遺忘指令的機率 |
| 輸出節點 (Output Nodes) | 決定結果的呈現方式。 | 支援純文本、結構化表格、可下載文件(Google Docs, Sheets, Slides)或生成的媒體。直接輸出至 Workspace 是其架構上的巨大優勢 |
2.2 多模態模型的協同運作(Multimodal Orchestration)
Opal 的獨特之處在於其能夠在單一工作流中無縫編排多個不同的 AI 模型。進階編輯器允許用戶為特定步驟選擇特定的模型,以優化成本、速度或品質。
- Gemini(文本與邏輯): 作為核心引擎,負責推理、摘要、編碼和文本生成。最近的更新整合了 Gemini 2.5 和 3.0 的能力,顯著增強了推理深度4。
- Imagen(視覺): Opal 可以調用 Imagen 4(或 3)根據 Gemini 節點的中間文本輸出生成高保真圖像。例如,一個工作流可以接受故事大綱(文本輸入),由 Gemini 撰寫場景描述(生成節點 1),再將該描述傳遞給 Imagen(生成節點 2)進行視覺化16。
- Veo(影片): 針對影片生成,Opal 整合了 Veo(Google 的生成式影片模型),允許工作流產出動態媒體資產。這對於行銷和社交媒體自動化來說是一個極具破壞力的功能4。
2.3 雲原生執行與狀態管理(Cloud-Native Execution)
與本地腳本或瀏覽器擴充功能不同,Opal 應用程式完全在 Google 的雲端基礎設施上運行。當用戶執行 Opal 應用程式時,數據流經 Google 的資料中心,觸發對各種模型的 API 調用。
- 持久性(Persistence): 應用程式的定義(提示詞鏈、系統指令、UI 佈局)被保存為一個「Gem」。這種狀態持久性允許應用程式被無限次重用,而不會出現「漂移」行為——這是標準聊天中常見的問題,即隨著上下文窗口被無關的閒聊填滿,模型表現會逐漸下降2。
- 零部署分享(Zero-Deployment Sharing): 由於 Opals 是雲端物件,它們可以透過簡單的 URL 進行分享。權限模型鏡像了 Google Drive(私人、特定人員共享或公開),使得部署變得即時。這種模式消除了託管、伺服器配置或編譯的需求,移除了軟體開發的傳統障礙8。

3. 用戶體驗深度解析:解鎖「進階編輯器」
正如原始請求中所述,這個功能「非常的隱密,但是非常的強大」。這種二分法是 Google 雙重介面設計策略的結果,旨在同時滿足休閒用戶和高級用戶(或稱「氛圍編碼者」)。
3.1 對話式構建器:無痛的入門磚
大多數用戶首先在 Gemini 的「Gem Manager」中接觸到 Opal。在這裡,介面提出一個簡單的問題:「你想構建什麼?」
- 運作機制: 用戶輸入自然語言提示(例如:「製作一個膳食計劃器」)。在後台,一個專門的「元模型」(Meta-Model)解釋這個意圖,並編寫代碼(或 JSON 配置)來構建工作流節點。
- 結果呈現: 幾秒鐘內,應用程式的預覽就會出現。這將入門門檻降至近乎零;如果你會發送簡訊,你就能構建應用程式。然而,這個介面往往隱藏了複雜性,呈現出簡化的視圖,可能會掩蓋系統的全部能力11。
3.2 進階編輯器:專家的遊樂場
「進階編輯器」(Advanced Editor,通常透過預覽中的按鈕或直接訪問 opal.google.com 進入)才是 Opal 真正的力量所在。從對話式構建器過渡到進階編輯器,是用戶從「消費者」升級為「創造者」的關鍵一步19。
3.2.1 視覺化圖譜(Visualizing the Graph)
在進階編輯器中,抽象層被剝離。用戶可以看到數據的原始流向:
- 連接線與數據流: 用戶可以清楚看到哪個步驟的輸出流入哪個步驟。例如,用戶可能會發現圖像生成步驟錯誤地使用了「用戶的原始輸入」,而不是前一步驟生成的「優化後提示詞」。視覺化編輯器允許他們拖曳連接線至正確的來源,這種除錯能力在標準聊天中是不可能實現的4。
- 節點級提示工程: 在簡化視圖中,通常只有一個「系統指令」。但在進階編輯器中,每一個節點都可以擁有自己獨立的系統提示詞、溫度(Temperature)設定和模型選擇。這允許創建「代理式工作流」(Agentic Workflows),其中一個節點扮演「批評者」(被提示要懷疑),另一個扮演「創造者」(被提示要富有想像力),形成自我修正的迴圈3。
3.2.2 「混音」(Remixing)與模板文化
進階編輯器支援「混音」功能——即複製現有的公開 Opal 應用程式的整個節點結構並進行修改。這培育了一種開源式的文化,分享的是「提示詞架構」而非傳統代碼。用戶可以找到一個「YouTube 摘要器」應用程式,進行混音,並將最後的「輸出為文本」節點替換為「輸出為西班牙語翻譯」節點,在幾秒鐘內創造出一個新工具9。
3.3 「應用程式」與「編輯器」視圖的分離
Opal 明確區分了 編輯器視圖(用於構建)和 應用程式視圖(用於使用)。
- 應用程式視圖: 這是乾淨的、面向終端用戶的介面。它隱藏了提示詞和邏輯,只顯示輸入欄位和結果。這種關注點分離對於企業用例至關重要,因為管理者可能希望員工 使用 工具,而不必讓他們理解背後的 提示工程4。
- 生成式 UI(Generative UI): Opal 根據工作流動態構建 UI。如果工作流需要上傳圖像,UI 會渲染一個放置區;如果需要從列表中選擇,UI 會渲染下拉選單。這種能力消除了對前端開發知識(HTML/CSS/React)的需求,進一步壓縮了開發週期4。

4. 戰略分析:為什麼 Opal 是 Google 的殺手鐧?
Opal 的推出不僅僅是功能的增加,它是 Google 重新定義 AI 平台戰爭的戰略舉措。透過分析競爭格局,我們可以識別出幾個關鍵的驅動因素。
4.1 與 OpenAI GPTs 及 Anthropic Artifacts 的深度對比
Opal 的主要競爭對手是 OpenAI 的「GPTs」和 Anthropic 的「Artifacts」。雖然它們有相似之處,但 Opal 的架構選擇提供了獨特的優勢。
| 功能特性 | Google Opal (Gemini) | OpenAI GPTs | Anthropic Artifacts |
| 創作方法 | 視覺化工作流 + 自然語言 ("氛圍編碼") | 對話式構建器 + 知識庫檢索 | 對話式 (在聊天中生成 React 組件) |
| 邏輯結構 | 顯式多步驟工作流 (DAG) | 單一系統提示詞 + 工具 (隱式邏輯) | 單一聊天上下文 (線性) |
| 多模態整合 | 原生鏈接 (Gemini -> Imagen -> Veo) | DALL-E 3 整合 (對話內) | 主要是文本/代碼 |
| 部署形式 | 即時網頁應用程式 (URL) | 聊天介面 | 側邊欄預覽 |
| 生態系整合 | 深度整合 (Docs, Sheets, Drive) | 有限 (透過 API 的 Actions) | 有限 |
| 目標用戶 | 專業消費者, 內部商業工具, 創作者 | 消費者, 開發者 (透過 Actions) | 開發者, 程式設計師 |
- 結構性優勢: OpenAI GPTs 嚴重依賴單一且巨大的系統提示詞。如果任務需要五個不同的步驟,模型必須「記得」按順序執行它們。Opal 的節點式方法 強制 步驟按特定順序發生,顯著提高了複雜流程的可靠性。它將「邏輯流」(圖譜)與「智能」(模型)分離,而 GPTs 則將兩者混為一談12。
- Artifacts 的區別: Anthropic 的 Artifacts 非常適合即時生成代碼片段或單頁 React 應用,但它們通常是無狀態的,存在於聊天記錄中。Opal 應用程式是持久的、獨立的實用工具,存在於聊天流 之外,這使得它們更適合重複的商業流程12。
4.2 微型工具的「App Store」
Google 實際上正在建立一個去中心化的 App Store。透過允許用戶通過公共連結分享 Opals,他們正在創造一個「微型實用工具」(Micro-utilities)的市場。這些應用程式太小,不值得傳統工程團隊開發(例如:「一個根據特定正則表達式重命名文件並通過電子郵件發送給 Bob 的工具」),但如果只需 30 秒就能構建,其價值就顯現出來了。
- 軟體的長尾效應: Opal 捕捉了軟體需求的「長尾」——超特定、臨時或利基的用例,這是 SaaS 公司永遠不會觸及的領域。這使得創新民主化,讓行銷經理或教師也能成為自己工具的「開發者」2。
4.3 透過 Workspace 實現生態系鎖定
最強大的戰略槓桿是整合。Opal 應用程式可以原生讀取 Google Drive 並寫入 Google Docs 或 Sheets。
- 場景模擬: 用戶創建一個 Opal,輸入會議錄音(影片輸入),使用 Gemini 轉錄並摘要(生成節點 1),使用 Gemini 提取行動項目(生成節點 2),然後將這些項目直接寫入共享的 Google Sheet(輸出節點)。
- 戰略意涵: 這種工作流具有極高的黏著度。它使 Google Workspace 不僅僅是生產力套件,而是 AI 代理的操作系統。像 OpenAI 或 Perplexity 這樣的競爭對手,如果沒有用戶授予複雜的第三方權限,很難複製這種深度整合12。
5. 全方位應用場景分析:從個人到企業的賦能
Opal 的多功能性允許其跨越不同領域。我們將擴展分析十個具體的應用場景,展示從「詢問 AI」到「僱用 AI」的轉變。
5.1 內容創作與行銷自動化
- 社交媒體引擎: Opal 應用程式設計為接受部落格文章的 URL 作為輸入。
- 步驟 1: Gemini 讀取 URL 並提取關鍵點。
- 步驟 2: Gemini 根據關鍵點撰寫 LinkedIn 貼文、Twitter 推文串和 Instagram 說明。
- 步驟 3: Imagen 為貼文生成相關的高品質圖像。
- 步驟 4: 應用程式在一個乾淨的介面中輸出所有資產,供用戶複製/貼上。
- 效益: 品牌聲音的標準化與巨大的時間節省17。
- 多模態故事書: 用戶輸入孩子的名字和主題。應用程式生成一個 5 頁的故事,並為每一頁使用 Imagen 生成匹配的插圖。這展示了在迴圈中鏈接文本和圖像模型的力量10。
- YouTube 縮圖生成器: 輸入影片標題與概念,Gemini 生成視覺描述,Imagen 根據描述生成 4 張不同風格的縮圖供選擇25。
5.2 企業與商業智慧 (BI)
- 競爭分析儀表板: 分析師構建一個 Opal,輸入競爭對手的網站 URL。
- 步驟 1: 「深度研究」(Deep Research)掃描網站的定價、訊息傳遞和新功能。
- 步驟 2: Gemini 將此數據與上傳的自家產品規格 PDF 進行比較。
- 步驟 3: 輸出格式化為 PDF 或 Google Slide 的「戰鬥卡」(Battle Card),供銷售團隊使用6。
- 合約審查自動化: 法務助理使用專為 NDA 審查設計的 Opal。
- 輸入: NDA 的 PDF 檔。
- 過程: Gemini 將條款與隱藏的「公司標準手冊」(作為 Gem 中的知識資產上傳)進行比較。
- 輸出: 標註風險條款並建議修改的紅線文本18。
- 招聘篩選助手: HR 上傳候選人履歷(PDF)與職位描述。Opal 自動提取技能匹配度,生成面試問題,並將結果存入 Google Sheets 候選人資料庫。
5.3 教育與個人生產力
- 蘇格拉底式導師: Opal 應用程式扮演導師角色。系統提示詞被設計為只問引導性問題而不給出答案。工作流循環,接受學生的回答,分析誤解,並生成下一個問題。
- 健身計劃生成器: 輸入身體數據、可用設備和時間限制,Gemini 生成運動表格,並透過搜索工具連結到相關的影片教程26。
- 學術論文摘要與視覺化: 輸入 PDF 論文,Gemini 生成摘要,並將關鍵數據點轉換為 Mermaid.js 圖表代碼,最後渲染成流程圖。
5.4 開發者輔助
- 正則表達式生成與測試器: 輸入所需的匹配規則(如「提取所有電子郵件」),Gemini 生成 Regex 代碼,並自動在一組測試文本上運行驗證,輸出通過/失敗的結果。
6. 進階編輯器大師班:解鎖「隱藏」功能的實戰指南
用戶在原始請求中提到「進階編輯器」是解鎖 Opal 潛力的關鍵。本節將詳細介紹這個環境中的具體功能,以及如何利用它們超越標準的 Gemini 聊天。
6.1 變數處理與數據流 (Variable Handling)
在標準聊天中,上下文是流動的。在進階編輯器中,上下文是顯式的變數。
@語法: 用戶可以使用@符號引用特定步驟的輸出。例如,@Step1.output將第一步的結果注入到第三步的提示詞中。這允許非線性的數據使用——步驟 4 可以同時使用步驟 1 和步驟 3 的數據11。- 步驟命名: 進階用戶可以命名步驟(例如:「Extract_Keywords」、「Generate_Image_Prompt」)。這是除錯的最佳實踐,因為它使應用程式邏輯的「蹤跡」變得可讀14。
6.2 提示詞鏈接策略 (Prompt Chaining)
視覺化編輯器鼓勵複雜的提示詞策略:
- 精煉鏈 (Refinement Chains): 步驟 1 生成草稿。步驟 2 扮演編輯角色,批評草稿。步驟 3 結合批評撰寫最終版本。這種「草稿-批評-精煉」的迴圈產出的品質顯著高於單一的「零樣本」(Zero-shot)提示4。
- 格式轉換: 工作流可以從非結構化文本(輸入)開始,將其解析為 JSON(步驟 1),然後使用該 JSON 填充結構化報告(輸出)。這允許 Opals 與需要結構化數據的系統對接14。
6.3 工具調用 (Tool Invocation)
除了生成文本,Opals 還可以調用工具。
- Google Search: 這個工具可以針對特定步驟開啟或關閉。一個「事實查核」步驟可能啟用搜尋,而一個「創意寫作」步驟可能禁用它以防止將現實世界的數據幻覺化入虛構故事中22。
- 上下文檢索 (RAG): 用戶可以上傳大量的知識庫(PDFs, Docs)到 Gem。進階編輯器允許控制 何時 查詢這個知識庫,優化 Token 使用和相關性6。
7. 限制與挑戰:實驗性產品的陰影
儘管功能強大,Opal 目前仍標註為「實驗性」(Labs),存在顯著的限制。一份細緻的報告必須指出這些問題。
7.1 可靠性與幻覺
雖然工作流結構減少了「漂移」,但底層模型(Gemini)仍然是機率性的。一個「生成」節點可能偶爾無法遵循格式指令(例如,被要求輸出 JSON 時卻輸出 Markdown),導致期待 JSON 的下游節點崩潰。Opal 目前的錯誤處理機制相當初級;如果一步驟失敗,應用程式通常會停滯或輸出錯誤文本12。
7.2 行動端體驗的斷層
目前,透過進階編輯器 創建 和 編輯 Opal 主要針對桌面端(Web)進行優化。雖然 Opals 可以在 Gemini 應用程式或手機瀏覽器上 運行,但在小螢幕上管理複雜的視覺化圖譜極其困難。這限制了「隨處構建」的潛力9。
7.3 數據隱私與企業顧慮 (Shadow IT)
對於企業用戶來說,「影子 IT」(Shadow IT)的風險是巨大的。如果員工開始構建自己的 Opals 來處理公司數據,IT 部門將失去對數據流向的可見性。雖然 Google 為 Gemini 提供了企業控制,但 Opal 的「Labs」性質使其在合規性和數據駐留保證方面處於灰色地帶。Google 明確指出,在實驗階段,人類可能會審查一小部分提示詞以進行故障排除,這對於敏感數據來說是一個紅旗27。
7.4 「Beta」性質的不確定性
作為一個實驗性功能,Google 保留隨時棄用或徹底改變 Opal 的權利。用戶在 Opal 上構建關鍵業務工作流面臨著工具可能隨時變更的風險——這是 IT 社群中常見的「Google 墳場」(Google Graveyard)焦慮9。
8. 未來展望:通往「反重力」(Antigravity) 與代理 AI 之路
Opal 的出現很可能是更高級系統的前奏,洩漏消息和傳言暗示了「Project Antigravity」或「Gemini 3.0 Agentic capabilities」的存在11。
8.1 從鏈接到代理 (From Chains to Agents)
目前,Opals 大多是「DAGs」(有向無環圖)——它們按照預定路徑從開始流向結束。下一個演進是 循環 或 自主 代理。
- 迴圈與條件判斷: 未來的版本可能會支援「If/Else」邏輯(分支)和「While」迴圈(迭代直到滿足條件)。這將允許 Opal「持續研究直到找到 5 個來源」或「如果情緒是負面的,草擬道歉信;否則,草擬感謝信」。目前透過巧妙的提示工程可以實現部分功能,但原生 UI 支援是下一個前沿11。
- 非同步執行: 目前,用戶看著步驟發生。未來的 Opals 可能會在後台運行,監控電子郵件收件箱或數據流,僅在必要時觸發12。
8.2 變現與創作者經濟
隨著「分享」功能已經到位,合乎邏輯的下一步是變現。Google 可能允許高實用性 Opals 的創作者對訪問收費,創造一個「提示工程師」轉變為「微型 SaaS 創始人」的新經濟。這將直接挑戰 OpenAI GPT Store 的模式1。
8.3 與硬體的整合
隨著 Google 將 Gemini 更深入地整合到 Android(Pixel 設備)和智慧家居設備(Nest)中,Opals 可能成為控制物理世界的「腳本」。一個 Opal 可以由語音命令觸發:「檢查安全攝像頭,總結活動,並鎖上門」,將視覺模型與 IoT API 鏈接起來1。
9. 結論:專業部落客的觀點
Google Opal 代表了技術民主化的一個分水嶺時刻。透過將軟體工程的複雜性抽象為「氛圍編碼」——一個視覺化、自然語言驅動的過程——Google 賦予了新一類創作者權力。「進階編輯器」雖然目前隱藏在 Labs 介面中,但它讓我們得以一窺人機互動的未來:用戶扮演邏輯的 架構師,而 AI 扮演執行代碼的 承包商。
對於 IT 專業人士、部落客和 AI 愛好者來說,Opal 不僅僅是一個需要評測的功能;它是一項需要掌握的技能。它標誌著一種轉變:構建工作流和表達意圖的能力,將比編寫語法的能力更有價值。雖然目前處於實驗階段且容易出現 Beta 軟體的怪癖,但軌跡是清晰的:Opal 是我們在生成式 AI 時代構建、分享和使用軟體的藍圖。
正如原始輸入所預言,「可預知的未來,Google Gemini 或是 GEM 會有這個新的利器產生。」現在,這個未來已經到來,而且它比我們想像的還要觸手可及。進階編輯器的「隱藏」性質可能只是暫時的。隨著功能成熟並證明其實用性,我們可以預期它將從「Labs」邊緣移動到 Gemini 體驗的核心,從根本上將 Google 的產品從搜尋引擎和聊天機器人提供商,轉變為世界上最大的開發平台。
附錄:核心術語對照表
為了幫助讀者更好地理解,以下整理了本文中使用的關鍵術語及其在 Google Opal 上下文中的定義。
| 術語 | 定義與 Google Opal 上下文 |
| Opal | Gemini 內部無代碼應用程式構建器的代號與引擎。 |
| Gem (Standard) | 具有單一系統指令(角色設定)的自定義 Gemini 版本。 |
| Gem (Labs/Opal) | 具有獨特 UI、工作流邏輯和多模態能力的「微型應用程式」。 |
| Vibe Coding (氛圍編碼) | 透過自然語言描述意圖("Vibes")而非語法來進行編程的方式。 |
| Node/Step (節點/步驟) | Opal 工作流中的單一邏輯單元(輸入、生成、輸出)。 |
| Advanced Editor (進階編輯器) | 用於編輯節點圖譜和微調提示詞鏈的視覺化介面。 |
| Remixing (混音) | 複製並修改現有 Opal 應用程式結構的能力。 |
1
10. 深度研究:如何開始您的第一次「氛圍編碼」?
為了讓這篇文章對您的讀者更具實用性,以下提供一個實際的操作指南,幫助他們找到並掌握這個隱藏功能。
步驟 1:進入隱藏介面
- 前往
gemini.google.com。 - 在左側邊欄,找到「Gems」部分。
- 尋找「Gems made by Labs」(實驗室製作的 Gems)或「New Gem」按鈕。
- 關鍵步驟: 當對話介面出現時,不要 只是聊天。尋找提示:「Describe the AI mini app you want to build」(描述你想構建的 AI 微型應用)。
- 一旦預覽生成,尋找「Open Advanced Editor」(開啟進階編輯器)按鈕(通常是一個類似圖表或扳手的圖示)。這將把用戶重定向到完整的視覺化環境(Opal 編輯器)9。
步驟 2:設計工作流
- 定義輸入: 拖曳一個「Input」節點。如果是構建視覺分析器,將其配置為「Image」;如果是寫作助手,則配置為「Text」。
- 鏈接邏輯: 拖曳一個「Generate」節點。將 Input 節點連接到 Generate 節點。
- 技巧: 使用
@選單選擇特定的輸入變數。 - 技巧: 選擇模型。使用「Gemini 1.5 Flash」追求速度(例如簡單重寫),使用「Gemini 2.5 Pro」進行複雜推理4。
- 技巧: 使用
- 精煉輸出: 拖曳一個「Output」節點。選擇「Rich Text」用於部落格文章,或「Google Sheets」用於數據任務。
步驟 3:迭代與除錯
- 使用進階編輯器右側的「Preview」(預覽)窗格。
- 使用測試數據運行應用程式。
- 觀察「執行流」(通常在圖表中高亮顯示)。如果某一步驟產生了糟糕的結果,點擊該特定節點,編輯提示詞(例如,添加「更簡潔一點」),然後重新運行。這種細顆粒度的除錯是 Opal 獨有的4。
步驟 4:發布與分享
- 點擊「Share」(分享)。
- 選擇「Public Link」(公開連結)。
- 複製 URL。這個連結現在可以嵌入部落格文章、分享到社交媒體或發送給同事。接收者無需「安裝」任何東西;它會在他們的瀏覽器中立即打開9。
透過掌握這些步驟,用戶將從被動的 AI 消費者轉變為積極的開發者,解鎖「Google Opal」生態系統的真正潛力。