Talat的AI会议记录保留在您的计算机上,而不是云端

由人工智能驱动的笔记应用Granola估值2.5亿美元,已成为科技行业创始人和风险投资人中的主流工具。但一位开发商认为,人们需要一种更私密、仅限本地的替代方案,只需一次性付费且无需订阅。这导致了一款名为Talat的新Mac应用程序的创建。

英国约克郡的开发者尼克·佩恩(Nick Payne)自称是电脑迷,他表示,建立本地人工智能记事本的想法主要是由于一系列愉快的意外而产生的。

“我认为Granola很棒;它是一个光辉的例子,说明只要有足够的爱和关怀,你可以使用Electron应用程序(构建桌面应用程序的框架)做些什么,”他告诉TechCrunch。 “当我第一次尝试它时,我着迷的是它能够在我的Mac上录制系统音频而不录制视频,这是当时的标准解决方法。这引发了大量的研究,发现了一个相对较新且记录很少的Apple API。”

为了更轻松地使用该API(Core Audio Taps,可让开发人员利用Mac的音频流),Payne决定创建一个开源音频库AudioTee。

“在那段时间,我慢慢地拼凑出一个工具包,但我从未发现任何东西可以独立作为一个产品,而不仅仅是一个很酷的技术演示,”佩恩说。 “最先进的托管转录模型——与格兰诺拉等人使用的提供商相同——令人难以置信,看到你的演讲近乎实时地在屏幕上展开真是太酷了。但它总是让我烦恼,这种权衡不仅需要提供我的数据,还需要提供我的音频数据;我的真实声音,”他补充道。

然后,他偶然发现了一个名为FluidAudio的软件工具包,这是一个Swift框架,可以在Apple设备上实现完全本地、低延迟的音频AI。它可以让您直接在Mac的神经引擎(Apple用于AI处理的专用硬件)上运行小型、快速的转录模型。

正是这篇文章让佩恩意识到他可以将他的研究转化为实际的产品——你的音频永远不会离开你的Mac,你的文字记录也不会存储在另一家公司的服务器上。

Talat是Payne的老朋友兼前同事Mike Franklin共同创建的,是Payne对音频领域兴趣的成果。结果是一次20MB的购买,不需要您创建帐户,甚至不需要与开发人员共享分析数据。也没有持续的费用。

虽然一些人工智能记事本可能有更多花里胡哨的功能,但Talat提供了一套精简的功能。当您使用Zoom、Teams、Meet等会议应用程序时,它会从计算机的麦克风捕获音频,并实时转录。该应用程序尝试实时分配扬声器,但您可以据需要重新分配它们。您还可以做笔记,并编辑、删除或拆分转录片段。会议结束后,当地法学硕士会生成一份包含要点、决策和行动项目的摘要。

笔记、文字记录和摘要也都可以在塔拉特中搜索。

除了隐私角度外,佩恩表示,目标是为用户提供更多选择。

“我们倾向于可配置性,让用户控制数据的去向:选择自己的LLM、自动导出到 [笔记应用程序] Obsidian、在会议结束时推送数据的网络钩子、MCP服务器,”这是人工智能工具连接到外部数据源的标准化方式,“按需提取数据,”他解释道。

佩恩指出,在幕后,人工智能是一个混合体——“大部分是缝合在一起并抽象在FluidAudio后面”,他认为这是完成了很多繁重的工作。作为总结,该应用程序默认使用名为Qwen3-4B-4bit的Al模型,该模型甚至可以在相当普通的硬件上运行。

然而,用户可以选择将其切换到他们选择的任何云LLM提供商,或者他们可以在两个Parakeet变体(Nvidia开发的语音识别模型)之间进行选择,或者将其指向Ollama(一种在本地运行AI模型的工具),从而使他们能够更好地控制体验。随着时间的推移,Talat将添加对更多内置选项的支持,并将集成其他应用程序,例如Google Calendar和Notion。

发布时,拥有M系列Mac电脑(运行Apple自家处理器的用户,从M1开始)可以下载该应用程序并免费试用10小时的录音,然后再决定购买。

Talatis的预发布版本售价为49美元,该版本仍在积极开发中。

当该应用程序发布1.0版本时,价格将上涨至99美元。

佩恩和富兰克林正在初创公司Talat,并计划继续将核心产品保持为一次性购买。

← 上一篇文章 BKR Capital筹集了1,450万美元(迄今为止)来投资黑人创始人 下一篇文章 → OpenAI添加开源工具以帮助开发人员构建青少年安全

← 返回列表