安防行业最近风波不断。美国移民与海关执法局接入Flock摄像头网络监控民众,家用摄像头品牌Ring又因新增功能让执法部门能直接向屋主索要周边录像而挨批。安全、隐私、谁在看谁,这些话题吵得沸沸扬扬。
争议归争议,市场还在长。视觉语言模型越做越强,给那些想帮企业盯住自家场地的创业公司添了一把火。Conntour这家成立才两年的视频监控初创公司,联合创始人兼CEO Matan Goldner直言,伦理问题很重要,他们对客户挑得很严。听起来不像初创该有的生意经,可Goldner说他们挑得起,因为手里已经有几家大型政府和上市公司客户,其中一家是新加坡中央毒品局。
“有这些大客户撑腰,我们就能选客户、控使用场景,只接我们觉得道德且合法的单子。”Goldner在接受独家采访时说。他们会根据具体客户的使用意图下判断,而不是来者不拒。这份底气,让公司在种子轮融资时显得格外从容。700万美元到账,领投方包括General Catalyst、Y Combinator,还有SV Angel和Liquid 2 Ventures。整个过程只用了72小时。Goldner回忆,他排了大约90场会,从周一开始谈,周三下午就敲定。
Conntour的核心产品是一套AI视频平台,专为安防摄像头打造。保安人员用自然语言就能查询镜头:找人、找物、找场景,实时出结果,活像给监控视频装了个谷歌搜索。它还能按预设规则自动监测威胁,主动推送警报。
跟老一代系统不同,那些系统靠固定参数抓特定物体、动作或行为,灵活性差。Conntour靠视觉语言模型,弹性大得多。你可以问“找出大厅里穿运动鞋的人递包的画面”,系统立刻在所有录像或实时流里翻,甩出相关片段。结果不光是视频,还配文字解释,甚至能一键生成事件报告。
真正拉开差距的是扩展性。Goldner强调,他们的系统能高效处理几千路摄像头。单块消费级GPU,比如Nvidia RTX 4090,就能同时管50路视频。他们用多个模型和逻辑系统,根据每条查询智能挑最省资源的组合,既保证效果,又把算力压到最低。
部署方式也灵活:全本地、全云端,或者混合都行。可以直接插进现有安防系统,也能当完整监控平台用。平台还贴心给出置信分数。如果摄像头光线差、分辨率低、镜头脏,搜索结果就会标低置信度,避免误导。
行业老毛病一直有:监控质量取决于原始画面质量。昏暗停车场、低清脏镜头,细节根本看不清。Conntour用分数机制对冲这个风险。往前看,Goldner说最大技术难题是同时满足两件事:一边要给用户接近完整大模型的自然语言灵活度,想问啥问啥;另一边还要极致省资源,因为处理几千路视频的算力消耗会疯掉。这对矛盾,正是他们在死磕的点。
公司目前客户以政府和大企业为主,新加坡中央毒品局的案例显示,他们的工具已经帮警方快速定位关键时刻,节省人力也可能救命。YC Winter 2025批次出身,团队15人,还入选了Palantir首届fellowship,顾问里有前CIA CTO Bob Flores,技术背书不弱。
眼下加密市场整体承压,BTC现报$69,789(24h -2.56%),ETH现报$2,089(24h -4.45%),但AI应用层的需求没停。安防这个垂直赛道,隐私争议和实际需求并存,Conntour用挑客户和强扩展性给自己留了余地。接下来他们要继续攻那个效率与灵活性的死结,至于市场会不会因为争议而收缩,谁也说不准。现实是,摄像头越来越多,AI搜得越聪明,有人就越愿意付钱。