
一家刚刚起步的荷兰初创公司希望帮助公司从大量复杂的文档中获取额外的数据,这些文档的准确性和安全性至关重要——该公司刚刚获得了谷歌Gradient Ventures的支持。
这家名为Send AI的初创公司正在与UiPath、Abbyy、Rossum和Kofax等文档处理领域的老牌企业展开竞争,该公司拥有一个可定制的平台,允许企业根据自己的个人数据提取需求微调人工智能模型。
例如,在保险等监管严格的行业中运营的公司可能需要处理各种格式,从pdf和纸质文件到智能手机拍摄的各种方向和背景“噪音”照片。这种非标准的“非结构化”数据类型对于人类来说可能非常棘手,但是完全由机器主导的方法可能导致错误的索赔拒绝或报销以及管理上的头痛。
实际上,典型的现成文档处理软件通常是为与多个行业交叉的更常见的文档类型而设计的,这使得它们不适合某些用例。另一方面,有了Send AI,公司可以训练一个计算机视觉模型来识别特定的文档,以及一个单独的语言模型来提取和验证相关数据——如果有任何疑问,人工会参与进来,通过网络界面控制和审查每一步。
Send AI创始人兼首席执行官Thom Trentelman告诉TechCrunch:“这种验证可以简单到检查预期数字是否真的是数字,或者在数据库中查找更复杂的注册号以查看是否匹配。”“任何不安全感都将报告给人工审查。”
Send AI于2021年在阿姆斯特丹成立,最初名为Autopilot,此前从一家大学毕业生校友基金获得了10万美元的小额投资,但随着它开始扩大规模,它现在已经在由谷歌的Gradient Ventures和Keen Venture Partners共同领投的种子期前融资中又获得了220万欧元(240万美元)的资金,DeepMind等公司的一些天使投资人也参与了融资。
公司可以通过api访问Send AI基于云的软件,该软件可以从通过电子邮件发送的文档中收集数据。收到后,Send AI会在视觉上增强文档,然后将其发送给语言模型进行分类和提取。
在目标市场方面,Trentelman表示,该公司主要针对大型企业,因为它们“最需要处理文档”,尽管事实上,任何处理大量文档的企业都可以找到这项技术的用途
发送AI:数据提取
不用说,除了市场上已经存在的大量现有文档处理工具之外,Send AI还面临着新一代初创公司的挑战,这些初创公司销售基于强大的新型大型语言模型(llm)的服务,比如OpenAI正在使用GPT-X(为ChatGPT提供支持)。不过,尽管特伦特尔曼承认,这类产品在需要“主观上好的”分数的情况下非常有效,比如总结或回答问题,在这些情况下,需要在大量文档中保持高度的准确性,但这是另一回事。
Trentelman说:“你迟早会在这些技术上碰壁——大型、通用的法学硕士仍然是不可预测的、缓慢的、昂贵的。”“在Send AI,我们让客户构建自己的解决方案。”
在底层,Send AI是建立在更小的开源模型上的,客户首先通过手工处理一小组文档来训练这些模型,然后在人手的帮助下对新文档进行冲洗和重复,以提供更正。
在定价方面,Send AI以信用为基础收费,客户按每个处理步骤付费。Trentelman说:“通过这种方式,我们可以区分处理50页的PDF文件还是只处理单个文本片段。”“我们的模型便宜、快速、可靠,因此我们可以为每个客户部署它们。通过这种方式,客户可以控制他们的数据和性能,这就是为什么我们在医疗保险和政府等受监管的行业表现出色。”
Send AI声称,它的技术将吸引高度监管的行业,因为它可以让客户对自己的数据进行控制,这似乎违反直觉,因为它完全基于云计算。然而,特伦特尔曼指出,OpenAI等公司的典型法学硕士是如何工作的,它可能会将来自多个不同客户的培训数据混合到一个模型中,这增加了敏感数据泄露的可能性。这正是为什么我们看到许多初创公司承诺在llm驱动的软件中保护私人数据的原因。
Send AI试图通过为每个客户部署小型、隔离的开源变压器模型来解决这些问题。
特伦特尔曼说:“我们使用各种各样的工具来完成工作,它们没有给人留下太大的印象,但一旦接受了高质量数据的训练,它们就会变得强大而精确。”
因此,虽然模型和相关的训练数据仍然存在于Send AI的云上,但使用孤立的模型意味着它可以精确定位数据的位置,从而根据要求删除数据。根据Trentelman的说法,这足以使其成为其他提供商的“首选”,并且在某种程度上使关注数据隐私的公司相信,内部部署不是他们唯一的选择。
“如今,更多受监管的公司允许供应商使用公共云,只要他们遵守一系列广泛的法规,”特伦特尔曼说。“一开始,我们总是被问到是否可以部署内部部署,但最终除了一家公司外,所有公司都选择了我们的公共云服务。”
目前,Send AI正处于内测模式,尽管它已经声称有一些令人印象深刻的客户,包括保险巨头安盛。该公司目前拥有7人的团队,计划在全面商业发布之前,利用新注入的资金,在全年内将员工人数增加一倍。