Amazon Bedrock助力飞书深诺:打造电商广告智能分类的“核心引擎”
关键词: Amazon Bedrock, 生成式AI, 大语言模型, 飞书深诺, 广告分类, 电商AI, 模型选型
在全球化电商的激烈战场上,每一秒都有数以百万计的商品广告被创建、投放和竞争。对于像飞书深诺这样的数字营销服务平台而言,如何高效、精准地处理海量、多语言的商品信息,并为其自动打上正确的分类标签,是提升广告效果、优化投放策略的关键一环。
传统的文本分类方法依赖于人工定制规则或训练专用的分类模型,不仅耗时耗力,且面临着多语言泛化能力弱、长尾类别识别差、模型更新迭代慢等固有瓶颈。面对瞬息万变的电商市场和客户多样化的需求,飞书深诺需要一个更智能、更灵活、更强大的解决方案。
而破局的关键,就在于生成式AI。
一、 挑战:电商广告分类的“拦路虎”
在引入生成式AI之前,飞书深诺的团队在广告自动分类上面临着几个核心挑战:
语言的巴别塔: 客户商品信息涵盖英语、日语、德语、西班牙语等数十种语言。为每种语言都训练和维护一个独立的分类模型,成本和技术复杂度极高。
品类的长尾效应: 电商品类层出不穷,从“智能手机”到“可持续竹制手机壳”,新的细分品类不断涌现。传统的模型难以快速适应这些新概念,导致长尾品类的识别准确率低下。
信息的非标准化: 商品标题和描述千奇百怪,充满营销词汇、缩写和拼写错误。例如,“iPhone 15 Pro Max 1TB 暗紫色”和“苹果手机最新款顶配深紫色”需要被识别为同一品类。模型需要具备强大的语义理解和泛化能力。
效率与成本的平衡: 自研并训练大型语言模型需要巨大的算力投入和顶尖的AI人才,对于追求业务敏捷性的企业来说,并非最优解。
二、 破局:为何选择Amazon Bedrock作为“AI底座”?
在评估了多种技术路径后,飞书深诺最终选择了基于 Amazon Bedrock 的生成式AI方案。Amazon Bedrock是一个全托管的服务,通过统一的API提供来自AI21 Labs、Anthropic、Cohere、Meta和Amazon等领先AI公司的高性能基础模型。
选择Bedrock,源于其四大核心优势:
免运维的便捷性: Bedrock作为全托管服务,彻底消除了基础设施管理的负担。飞书深诺的团队无需关心模型部署、扩缩容或版本更新,可以专注于构建业务逻辑和应用创新。
模型的多样性与灵活性: Bedrock如同一个“模型超市”,提供了多种顶尖的LLM选择。飞书深诺可以根据不同任务(如分类、摘要、关键词提取)的性价比和性能要求,灵活调用不同的模型,例如Anthropic的Claude系列在理解复杂指令和长文本方面表现优异,而Cohere的Command模型则在分类和语义搜索任务上非常出色。这种灵活性避免了“一个模型用到底”的局限。
卓越的多语言能力: Bedrock上的主流基础模型均在包含多语言数据的大规模语料上训练而成,天生具备强大的跨语言理解和生成能力。这意味着,飞书深诺只需一套提示词,就能处理全球大部分主流语言的商品信息,极大地简化了系统架构。
安全与隐私保障: Bedrock内置了安全合规特性,确保客户数据在传输和静止状态下的安全性。这对于处理企业客户数据的飞书深诺至关重要。
三、 实战:基于Bedrock的智能分类Pipeline构建
飞书深诺基于Amazon Bedrock构建了一套高效、精准的广告智能分类流水线。
核心流程如下:
数据接入与预处理: 系统接收来自不同渠道和客户的多语言商品原始数据(标题、描述、图片URL等)。
提示词工程: 这是发挥LLM潜力的关键。团队设计了精心构造的提示词模板,例如:
“你是一个专业的电商商品分类助手。请将以下商品信息归类到最合适的品类中。商品信息:‘
{商品标题和描述}
’。可选的顶级品类列表是:[电子产品,家居用品,服装配饰,美妆个护,...]
。请仅返回品类名称。”通过迭代优化提示词,模型能够更好地理解任务边界,减少幻觉,输出结构化的结果。
调用Bedrock API: 预处理后的数据和提示词通过API调用发送给Bedrock上的选定模型(如Claude 3 Sonnet)。
结果解析与后处理: 对模型返回的文本结果进行解析,提取出分类标签。系统还可以设置置信度阈值,对于低置信度的结果,可以转入人工审核或采用更复杂的模型进行二次判断。
反馈与迭代: 将人工校正的结果反馈给系统,用于持续优化提示词和模型选择策略,形成一个不断进化的智能闭环。
技术亮点:
零样本/小样本学习: 对于全新的品类,无需重新训练模型,只需在提示词中提供几个示例,模型就能迅速掌握分类规则,实现了“开箱即用”的敏捷性。
层次化分类: 通过设计多轮提示词或复杂指令,可以实现从“顶级品类”到“细分子类”的层次化分类,满足不同粒度的业务需求。
四、 成效:业务效率与效果的飞跃
引入Amazon Bedrock后,飞书深诺的电商广告分类能力实现了质的飞跃:
分类准确率大幅提升: 在多语言场景下,整体分类准确率提升了超过30%,尤其是在小语种和长尾品类上,效果提升更为显著。
运营效率指数级增长: 过去需要数据科学家花费数周时间标注数据、训练和调试模型的任务,现在通过调整提示词,在几天甚至几小时内就能完成迭代,实现了“模型即代码”的敏捷开发模式。
成本效益最优化: 按API调用次数付费的模式,使得飞书深诺无需承担高昂的GPU基础设施固定成本,实现了成本与业务量的完美匹配。
赋能业务创新: 精准的分类标签为后续的广告定向投放、受众分析、竞品洞察等高阶应用打下了坚实的数据基础,拓展了服务的深度和广度。
五、 展望与启示
飞书深诺的成功实践表明,生成式AI不再是实验室里的概念,而是能够直接驱动核心业务增长的强大生产力工具。 而像 Amazon Bedrock 这样的托管服务,极大地降低了企业应用前沿AI技术的门槛。
对于广大开发者和企业而言,飞书深诺的经验提供了宝贵的启示:
聚焦业务,而非基础设施: 将复杂的模型管理交给专业的云服务商,让团队能更专注于解决实际的业务问题。
提示词是新编程语言: 掌握提示词设计与优化的技巧,是解锁LLM潜力的关键。
从“模型为中心”到“应用为中心”: 未来的竞争不在于谁拥有最大的模型,而在于谁能最巧妙、最有效地利用模型创造业务价值。
结语
在智能营销的新纪元,飞书深诺通过携手Amazon Bedrock,不仅成功解决了电商广告分类的痛点,更构建了面向未来的AI驱动业务架构。这条路,为所有正在探索AI落地的企业点亮了一盏明灯:拥抱生成式AI,从选择一个可靠、强大的“AI底座”开始。