自然语言编程让应用开发变得前所未有的简单:只需向AI聊天机器人描述你的想法,它就能开始工作。虽然并非所有项目都能成为完美可用的成品,但仅通过对话来创建网页应用所需的努力已大大减少。
本次实验源于对现有电子阅读器功能的不满,尤其是其无法同时阅读和聆听有声书。这促使作者尝试用“氛围编程”来创建一个功能齐全的电子阅读网页应用,并将其命名为“Tome Reader”。该应用的核心目标是:能够朗读粘贴文本或上传的PDF/EPUB文件,并实现实时文本高亮;能根据文本内容(如中性、哥特恐怖、科幻、自然等类别)生成背景音乐;并能在朗读到特定触发词时实时生成额外的音效和视觉效果。整个项目被构建在单个HTML文件中,以便在浏览器中独立运行。
为了公平比较,作者设计了一套提示词优化策略:首先用Gemini构建项目基础版本,然后让其生成一个可复用的提示词;接着将该提示词上传至Claude进行迭代优化,并让Claude生成新的提示词;最后用优化后的统一提示词在Gemini、Claude和ChatGPT三个聊天机器人中分别开启新对话,测试其生成应用的一致性。
实测结果显示,Gemini相对轻松地实现了所有基础功能,并在项目初期解决了文本转语音语音加载等关键问题,为项目奠定了基础。Claude在触发词功能的底层逻辑上做出了出色的改进,扩展了词汇表并增强了可视化效果,但其自主决定限制每句只触发一次音效以避免干扰用户,这与预期功能存在偏差。ChatGPT的表现也提供了重要参考。整个实验表明,在利用AI聊天机器人进行开发时,精心设计和迭代优化的提示词是获得理想结果的关键,不同模型在理解指令和功能实现上各有特点。


