不经意间,这场燃烧了三年的AI热潮,已经悄然改变了我们的生活方式。我们开始习惯用AI写作、咨询,向它提出各种问题,搜索引擎的使用频率也在减少。这场改变世界的技术革命,正让那些有想法却不会写代码的普通用户,第一次有机会接触代码世界,体验创造产品的“酷”感。 Same.new正是这样一款AI开发利器。
创办Same.new的三位创始人,都是极具动手能力的开发者。联合创始人Aiden高中时便凭借开源项目Million.js在技术界崭露头角;另一位创始人Nisarg从小学开始编程,中学时开发的YouTube歌词生成器为他赚得数十万美金。
本次采访的联合创始人John,真诚地向我们分享了他对编程的纯粹热爱。
他回忆起高中九年级时,亲眼见证自己编写的神经网络在电脑上成功运行的那一刻,“这是我见过最酷的事情!”2019年GPT-2问世时,他收集数据训练自己的模型,比如为自己的萨克斯演奏生成钢琴伴奏。2022年ChatGPT横空出世、点燃AI热潮时,正在学习建筑的John毅然决定休学一年,“我必须重新回去写代码”。此后,他不断践行“Just Work”的理念:开发匹配建筑草稿的灵感收集器,制作能自动上网搜集资料的“Browsing Agent”。
展开剩余94%John的创业之旅,是一个在实践中寻找机会、在交流中碰撞灵感的过程。他加入过前OpenAI研究员创办的初创企业,在办公室的沙发上度过了六个月,专注研究如何用AI模型提升数学家的工作效率;与两位联创相识后,他们携手为Million.js拿下了不少企业合同。
John的创业既是一场充满激情的技术冒险,也是理性与感性交织的商业考量——既要实现技术理想,也要实现商业价值。2025年初,他和两位联合创始人从三天头脑风暴产生的150个创意中选中了Same。“让普通人也能做出赚钱的产品”的核心目标,与他们精通编程、热衷项目开发的背景完美契合。这也让Same面世后迅速走红,上线4个月就吸引了50万用户,并快速实现了300万美元的年度经常性收入(ARR)。
在John看来,这些数字并不是重点。真正的里程碑是让用户通过Same从“Make web apps”走向“Make money”。而他希望,自己会成为第一个用自己创造的产品赚到钱的人。
“2019年GPT-2出来时,机器学习的学术圈里大家都感觉得到这是一个非常不一样的东西。我就想要搞懂它。于是我写了一些项目,比如一个音乐Transformer。因为我吹萨克斯,就想给我的萨克斯生成钢琴伴奏,所以就自己搞了一个数据集并训练了一个小模型。当我的萨克斯声音输入时,它可以自动生成简单的钢琴伴奏。当时这真的很酷!”
“2019年GPT-2出来时,机器学习的学术圈里大家都感觉得到这是一个非常不一样的东西。我就想要搞懂它。于是我写了一些项目,比如一个音乐Transformer。因为我吹萨克斯,就想给我的萨克斯生成钢琴伴奏,所以就自己搞了一个数据集并训练了一个小模型。当我的萨克斯声音输入时,它可以自动生成简单的钢琴伴奏。当时这真的很酷!”
“创业的核心就是Just Work。我的工作方法就是写代码,然后看它运行的效果,保持快速迭代。说实话,有时我会直接发布“半成品”。这样可以观察到用户数据,我会在生产环境上迅速迭代功能。”
“创业的核心就是Just Work。我的工作方法就是写代码,然后看它运行的效果,保持快速迭代。说实话,有时我会直接发布“半成品”。这样可以观察到用户数据,我会在生产环境上迅速迭代功能。”
“程序员在开发项目时,复制别人的工作其实是一个很常见的流程。我猜自动化复制过程可能会是一个不错的市场切入点,所以我就开始写代码了。然后Same.new两个半月后就上线了。”
“程序员在开发项目时,复制别人的工作其实是一个很常见的流程。我猜自动化复制过程可能会是一个不错的市场切入点,所以我就开始写代码了。然后Same.new两个半月后就上线了。”
“产品的关键点在于模型之上的应用层。普通用户现在当然是不理解“Agent”这个概念的:他们不清楚模型的能力边界,也不知道自己想做的事到底有多难,要分成哪几步。当我们同时调用很多个“Agent”,它们之间又是如何协调,并在这个过程中与用户持续合作的?现在大家衡量“Agent”的能力是去关注它的准确性、速度和性价比。未来会有更多动态性的指标。Same的“Agent”会越来越像“人”,而不是一个程序。”
“产品的关键点在于模型之上的应用层。普通用户现在当然是不理解“Agent”这个概念的:他们不清楚模型的能力边界,也不知道自己想做的事到底有多难,要分成哪几步。当我们同时调用很多个“Agent”,它们之间又是如何协调,并在这个过程中与用户持续合作的?现在大家衡量“Agent”的能力是去关注它的准确性、速度和性价比。未来会有更多动态性的指标。Same的“Agent”会越来越像“人”,而不是一个程序。”
“目前衡量Agent的Benchmarks都是基于单独任务和Unit Tests的,这很有局限性。我们想象一个员工,如果他只能完成某些特定、以知的任务,我会认为这不是一个非常好的员工,因为感觉不到他有一个有效的学习轨迹。就像人一样,我们对Agent的衡量会是把它放到一个没有去过的地方,让它去做没做过的事情,这其中最重要的是Agent自身的泛化能力。”
“目前衡量Agent的Benchmarks都是基于单独任务和Unit Tests的,这很有局限性。我们想象一个员工,如果他只能完成某些特定、以知的任务,我会认为这不是一个非常好的员工,因为感觉不到他有一个有效的学习轨迹。就像人一样,我们对Agent的衡量会是把它放到一个没有去过的地方,让它去做没做过的事情,这其中最重要的是Agent自身的泛化能力。”
01 GPT-2点燃创业火种,三位00后技术咖的相遇
ZP:先简单介绍一下团队的背景?
John:我是John,我的联合创始人是Aiden。他从高中开始编程,在10年级时写了一个开源项目——Million.js。这是一个优化React性能的转译器,可以在JS Framework Benchmark上把React的速度提升70%。Million.js在两年内获得了非常好的反响,获得了各种报道。
我们另一位联合创始人是Nisarg,他从小学就开始编程,在中学时写了一套系统,可以自动化生成YouTube歌词视频,并靠这个软件赚了几十万美金。
ZP:你创业的心路历程是怎样的?
John:我是在高中九年级了解到我喜欢编程。当时我们高中有位CS老师,在PhD结束后决定当老师,教授Machine Learning的课程。我上了他的课后就开始自己写Neural Network(神经网络)、自学线性数学。记得看到在我的破电脑上成功跑起来了Numpy写的CNN(convolutional neural network)时我心想:“天哪,这是我见过最酷的事情!”
2019年GPT-2出来时,机器学习的学术圈里大家都感觉得到这是一个非常不一样的东西。我就想要搞懂它。于是我写了一些项目,比如一个音乐Transformer。因为我吹萨克斯,就想给我的萨克斯生成钢琴伴奏,所以就自己搞了一个数据集并训练了一个小模型。当我的萨克斯声音输入时,它可以自动生成简单的钢琴伴奏。当时这真的很酷!
如此,高中后3年我就把时间就都花在了自己的项目上,学校里的成绩很不好。有幸我在12年级时获得了一些实习机会,感到以后我写代码工作不会找不到,就任性去了纽约Pratt Institute学建筑。Ironically,我在学建筑那年,正是AI开始爆发的第一年。从22年6月DALL-E 2发布到10、11月,无论是Midjourney、Stable Diffusion还是什么其他的模型,它们的进步速度都远超出了我的想象。
我写的其中一个系统可以上传我的建筑绘画草稿,自动返回与草稿里的Concepts匹配的建筑素材或灵感。另一个项目是通过Selenium工作的“Browsing Agent”:我想知道关于某个公司的信息时,模型就会自己去Google上浏览、导航,然后把信息下载下来进行报告。类似这样探索大模型边界的系统那一年我写了十几个。可惜我比较晚才开始研究代码生成,因为当时没有判断到模型会在这里进步的很快。
ZP:这两个项目怎么影响你的创业?
John:通过这些项目,我有幸遇见了Morph Labs的创始人Jesse Michael Han。Jesse是一个很厉害的研究员,他之前在OpenAI,我很荣幸他给了我和他一起工作的机会。大一结束后(2023年),我觉得至少应该休学一年,便去了旧金山在Morph工作了六个月。没钱,所以我就睡在公司的沙发上。这段经历对我来说非常重要,每天醒来就做各种实验微调大模型。
微调是需要真正上手做实验才能掌握“体感”,光学习理论是没什么用的。不同的数据集、不同的数据分布、不同的模型大小,哪怕进行相同的训练过程,最后对模型产生的影响都是不一样。所以培养对于模型的直觉一定需要上手实践。
我们当时做的是能生成Lean定理证明助理语言的模型。Lean和其他形式化证明语言的原理是任何数学的证明或者定理都可以用程序方式表示,进行过程形式化。简单说就是把数学逻辑通过一种非常flexible的语法表达为计算机可以运行的程序,然后编译这个程序。如果程序编译出错,就证明数学上的逻辑也存在错误。这样,通过计算机的形式化验证,就能发现用人类语言表达数学时可能被忽视的错误。
训练模型来做数学证明是非常困难却很有意义的工作,我想这是我一直以来技术上做过最酷的事情。现在,xAI几乎把学术圈所有做类似研究的人都招过去了,他们有很庞大的形式化数学研究团队。当你听到有人说想用AI解决数学问题,这大概率就是他所指的方向。
但是,研究这个方向的初创公司赚不到钱,我们虽然训练出了当时最好的Lean生成模型,用户却只有数学家和数学专业的学生。而且说实话,我们也根本没怎么考虑赚钱的问题。这也是我离开的原因。我意识到自己真正想做的是“做生意”,这对我很重要。我可以做研究,但我不想一辈子都只做研究。所以那时我一边探索各种想法,一边结识有趣的人,很有幸遇见了Aiden和Nisarg。
ZP:获得了Vue.js作者尤雨溪、Cloudflare CTO Dane Knecht、Cognition CEO Scott Wu等技术领袖的投资,他们看中了什么?带来了哪些帮助?
John:在硅谷、旧金山,你有机会认识很多人,也能和很多人交朋友。我们以前的工作中有一些积累,然后在24年做了一年Dev Tools。我们尝试广交朋友。
ZP:Same的团队文化有什么特点?如何在快节奏中保持高效的产品开发?
John:创业的核心就是Just Work。我的工作方法就是写代码,然后看它运行的效果,保持快速迭代。说实话,有时我会直接发布“半成品”。这样可以观察到用户数据,我会在生产环境上迅速迭代功能。
我们喜欢动手能力强、迭代速度快的小伙伴。因为初创公司没有时间每一个问题都思考很久再去写代码。很多东西是一种直觉。当你设计一个功能时,脑子里同时要想到至少其他3、4个功能,以及它们之间如何交互、影响产品。当团队中所有人都有非常全面的理解,并且可以交付代码深度的解决实际问题时,这个团队就会非常高效。
ZP:目前在招聘哪些关键岗位?理想的候选人需要具备什么素质?
John:我们现在在招4个岗位:产品工程师、研究工程师、平台工程师和高级软件工程师。
对于平台工程师和高级软件工程师,我会更侧重技术能力:他能否真正解决问题,看他是否可靠。对于研究工程师,我肯定会看他对大模型以及内部系统的直觉:能否感知到一个系统的机会在哪里、不足在哪里,同时也要看他是否具备评估模型应用的能力。对于产品工程师,则要看有没有自己思考、理解用户体验的一套逻辑。还有对产品是不是真的有兴趣,以此有很强的动手能力。
02 以“复制”为突破口,致力于让普通人也可以上线任何软件产品
ZP:从Million.js到Same.new:从React性能优化工具转向到Vibe Coding,这个转型是如何发生的?
John:我是跟着Aiden进入性能优化这个市场的。Aiden他从10年开始就泡在这个群体里,对优化网站性能的商业模式和潜在客户都非常清楚。我们认识后,他大一只读了三个月就辍学了。
2023年年底,我们很幸运地进入了YC。之后一年做了3款产品:Million Lint,React Scan,和React Scan Monitoring。它们都从不同的入口帮助企业监控和优化React网站性能。比如,点击一个按钮后卡片出现的速度如何?用户的反应如何?我们追踪到这些信息后会直接把数据连接到代码中的片段,找到问题并自动提交PR来优化。
我们签到了一些ok的合同,比如与Airbnb,Robinhood,Faire的试点。但是,达成一个试点合同通常要谈判两三个月。尤其是大型企业,对产品非核心的功能要求很多很多,然而满足这些要求,需要大量常规工程师来开发。
我们意识到在这个市场赚钱不太适合我们。每次销前销后,我们都需要做大量准备。作为年轻人和小团队,我觉得我们应该做更适合自己的业务。
2024年12月圣诞节期间,我们开了一个会,讨论2025年我们要赚多少钱。我们意识到,如果公司需要赚300万美金,我们三个人每人就需要赚100万美金。这个问题迫使我们真正思考每个人对公司的贡献,以及我们应该聚焦在什么事情上。当时我们用了三天时间,列出了150多个点子。
思考这些点子时,我是从用户的心理特征出发的:他们需要持续在线,必须非常乐于分享产品。这些事情背后有一个情感驱动的过程。先定义目标用户的心理特征,再看哪些市场我们有触达渠道,最后才看哪些领域,我们有一定的技术优势,并且能把之前的技术积累迁移过来。
程序员在开发项目时,复制别人的工作其实是一个很常见的流程。我猜自动化复制过程可能会是一个不错的市场切入点,所以我就开始写代码了。然后Same.new两个半月后就上线了。
ZP:Same的目标是什么?解决了用户什么痛点?
John:目标是让不会写代码的用户写出一个完整地产品,做好运营和维护,帮他赚到钱。
我们要做出一套系统可以自主帮助用户构思、开发、做后端、上线、补Bug。产品上线后可以监控使用流量、终端用户使用习惯,并通过这些数据持续地迭代产品。其实这里的每一步,现在的“Agent”系统都可以做好。难点在于如何把每一步无缝整合和表示给用户。因为每一次的错误都会累积影响,所以如何进行错误校正是关键。
产品的关键点在于模型之上的应用层。普通用户现在当然是不理解“Agent”这个概念的:他们不清楚模型的能力边界,也不知道自己想做的事到底有多难,要分成哪几步。当我们同时调用很多个“Agent”,它们之间又是如何协调,并在这个过程中与用户持续合作的?现在大家衡量“Agent”的能力是去关注它的准确性、速度和性价比。未来会有更多动态性的指标。Same的“Agent”会越来越像“人”,而不是一个程序。
ZP:目前Same的典型用户是什么样的?他们有什么共同特征?
John:我们现在最有价值的用户有两类:一是想要提高线上营销力的中小企业,二是独立的Studio或个人开发者。
过去,如果中小企业希望通过线上渠道进行营销获客并拓展业务的话,通常需要聘请专业的网站开发人员来负责开发并维护。这会带来两个问题:第一,外部开发人员往往不能充分理解企业的业务逻辑,导致沟通成本高昂,来来回回交流往复也不一定可以达成满意的效果;第二,由于与外部团队的合作缺乏长期稳定性,后续维护与功能迭代也总是困难重重。
通过Same.new,现在这些中小企业主们可以直接通过说话的方式就解决了他们的问题。Same的Web搜索能力对他们来说是一个很重要的功能。很多人脑子里有一个大致的想法,但却不知道从何处着手实现他们。现在他们只需要将看到的比较好的东西投喂给Same,或者让Same自行去搜索,就往往可以通过借鉴实现不错的效果。我们看到那些能够通过Same开发出生产级产品的用户总是很擅长为Same提供参考资料,让Same学习并实现他们所希望的效果。
对于个人开发者与小型开发工作室来说,快速实现最小可行性产品,快速上线验证迭代是非常成功的方法。Same能够快速完成基础的产品功能,完整的页面结构,以及SEO基础建设,这些都大大加速了开发者上线迭代的时间。过去使用像Wix这种建站工具需要一周才能完成的工作,如今使用Same只需要几个Prompt不到两三个小时就可以搞定了。
ZP:能否现场演示一下用户如何使用Same?从想法到网站上线的完整流程是怎样的?
John:直接和Same发消息就可以了,也可以加上文件和图片。告诉Same你的想法,Same会帮你自动帮你进行版本控制并进行部署。这应该是非常简单的过程。
图片来源:Same官网
ZP:用户如何从一个Business idea到最终有一个能盈利的网站?
John:现在有很多个人开发者,他们会去互联网上找各种热点和用户需求,比如构建一个导航站并通过广告盈利,或者构建一个为用户储存视频的托管网站,或者做一个设计插件等。这些产品或服务的开发在工程上其实并不复杂,也不需要很大代码量,背后的运营逻辑是能否找到终端用户的痛点并持续运营。我们现在能帮助用户的就是基于他们找到的某一问题,快速开发第一版本,自动部署,这样可以很方便的获得终端用户反馈。下一步的开发重点便是能不能利用这些反馈实现闭环,越来越自动化的去帮助我们的用户迭代他们的软件。
ZP:现在的产品形态和未来两三年的预期间,会有差距吗?
John:一定会有的。没有人知道两三年后AI能够达到什么能力。但我们相信有一些东西是不会变的,比如如何帮助用户建立对Same的信任,如何让用户可以自如地与Same一起工作。这需要我们的产品设计非常灵活,并且可以跟着用户和他们的项目一起“成长”。也许Same对用户来说可以成为一个亲近的伙伴,了解他们的喜好,了解他们在做的事情,并且能够主动和用户交流。
03 拒绝Framework束缚,让多个AI Agents像团队一样无缝协作
ZP:请介绍下Same的整体技术架构,有哪些关键技术组件?
John:我们要做出三套系统:一是对我们用户最有能力的Agent,二是支持许多不同能力和需求的用户们的产品结构,三是能同时运行许多个Agents和部署它们生成代码的基础设施。
ZP:理想状态下,Same应该能完成哪些任务?目前的能力如何?
John:目前衡量Agent的Benchmarks都是基于单独任务和Unit Tests的,这很有局限性。我们想象一个员工,如果他只能完成某些特定、以知的任务,我会认为这不是一个非常好的员工,因为感觉不到他有一个有效的学习轨迹。就像人一样,我们对Agent的衡量会是把它放到一个没有去过的地方,让它去做没做过的事情,这其中最重要的是Agent自身的泛化能力。
让Agents自动的去做生意,去开发、运营、迭代,其中每一步都是很难计量的技术问题。我们会把模型使劲推到能力边缘,然后试图通过许多不同的信息回馈和组织Inference的方法来最大化模型产出的经济价值。理想状态下,Same至少能够自己做出并维护一个Same哈哈。
ZP:如何设计用户与Agents的交互方式?如何处理用户模糊的业务需求?
John:Same会运行非常多的Agents。不同的Agents会互相去做不同的事,专注在不同的问题上,比如同时做开发、运营和管理数据。人类并不擅长同时处理很多件事情,所以用户于这些Agents交互需要一个共同的UI入口,我们还在寻找最好的展示这些Agents工作的方式。Agents会向用户汇报,但不需要每一步都有用户参与。
ZP:当Same生成的结果不符合预期时,如何引导用户进行有效的迭代?
John:我们的系统需要能够捕捉到生成结果的用户体验问题。除了Linter和Runtime Errors以外,这需要一个专门试用生成代码的Agent来测试。另外其实我们大多数用并不知道什么样的生成结果是最好的,只知道什么样是不好的,所以模型要查漏补缺,创造出一些用户没有想到的Features。我们也正在做能让Agents从和用户的交互中学习的算法,这个就不多说啦。
ZP:未来2-3年大模型技术的发展会如何影响Same的产品路线?
John:现在的模型会越来越大,但由于底层基础设施的不断迭代,它会变得便宜,并且越来越快。当然也有可能中间突然杀出个“黑马”,不用Transformer架构,或者能够通过Diffusion来生成文字,那这样会很大的改变我们的交互。虽然没有办法预知这些变化,但我们可以假设它们会发生的概率,从现在开始准备团队和认知,希望新技术出现时能快速Adapt。
04 重要的第一件事:帮用户从Make web apps到Make money
ZP:300万美元ARR证明了什么?用户的付费意愿如何?主要的收入模式是什么?
John:300万美金这是一个很小的数字。目前产品内置了收费模式是因为调用这些模型需要钱,如果不收费的话我们自己的钱会很快烧完。PMF不是一个能够提前预测的东西,而且像我们这种在训练市场里的公司甚至赚到钱都不一定有PMF,因为短期的Revenue很多都是大家的好奇心而已。所以重要的是,第一实现我们想做的事情——从帮助用户Make Web Apps到Make Money,第二是长期运营。
ZP:我们会关注什么指标?
John:我们最关心三件事情:一是长期到底为用户们赚了多少钱,二是Agent表现和用户期望之间的对齐,三是我们使用Tokens的数量。其他还有是比较传统的,比如用户留存,功能使用度等。每天最关注的还是Agent、UI和用户体验等哪些没达到的,然后不断迭代优化产品。
ZP:Same上线4个月就获得50万用户,如何保持这种增长势头?
John:现在的增长速度不是我们长期想要的。因为我们现在的产品还不够好,其实除了最初的Launch还没有多少投入在GTM上。增长还是需要产品主导的,当我们的产品做出了一个非常大的差异化时,Marketing一定会紧随其后。
ZP:3-5年后,希望Same成为一个什么样的公司?
John:我们会真的能做到帮用户去自动的赚钱。目前的商业模式是通过用户Prompt时的Tokens流量赚钱,但如果我们要长期存活下去,一定要为用户提供更持续、更基础性的价值。这样才能用户通过Same创作了一个软件线上生意,我们从中分成百分比。
ZP:在众多AI Coding工具中,Same的核心竞争力是什么?
John:我们的IQ和工作时间。
ZP:如何看待当前AI Coding领域的竞争格局?未来2-3年会发生哪些变化?
John:面向非开发者是一个不一样的市场。比如Cursor的用户大部分是有编程经验的人(我自己也是),这些程序员最终更看重效率,看重产品能不能提高写代码的速度和质量。而大部分普通用户为什么喜欢一个AI Coding产品是没有标准答案的,比如很多人用Windsurf可能是因为Logo好看。这也是Cursor无法专注于面向非开发者的原因之一,因为是完全不同的产品和设计,需要的能力和现在团队的能力是很不一样的。
ZP:随着AI能力增强,人类在“Coding任务”中的角色会如何变化?
John:软件只是一种载体,它是一种有着多种生成结果的创作模式。人类承担的工作肯定会改变,明显一点的之一是肯定会做更多Review。
ZP:这个赛道目前处于什么发展阶段?什么时候会迎来真正的爆发?
John:我认为目前还是非常早期,真正的爆发可能是看谁先帮用户赚到钱。
05 快问快答
ZP:您是否愿意分享一下您的星座或MBTI类型?
John:双子座和ISTJ。
ZP:日常生活中,您有哪些兴趣爱好?
John:打篮球和看书。
ZP:对您影响最大的一本书或一个人?
John:有很多,我可以发你一个书单,当有人问我推荐什么书的时候我都会推荐这个list。对我来说,我比较喜欢的是Richard Hamming的《The art of doing science and engineering》,这本书是他当时在Naval Academy(美国海军学院)面向master的一个课程书籍,它的每一个章节就是一节课,是最直接教给你如何从第一性原理和跨学科思考问题。
ZP:您最喜欢的Business是什么?
John:我最喜欢Costco,因为无论是创始人的故事,还是内部的文化,还有他们每天进步的态度,都是让我非常青睐的。我非常尊重那些遵循长期主义的生意,可以在一个很长的变动周期中找到一些不变的点并且日须不断的维护好。这是很难的,也是最好的。对于Costco这样的超市来说,有太多机会去寻找短期利益了。在实际的落地执行中,企业就会面临很多问题,这也是为什么很多超市都倒闭了。
ZP:您最常看/听的海外Blog和播客?
John:我常听播客Acquired,每一期他们都讲得非常好。(ZP注:Acquired是一档讲伟大公司故事和战略的播客)
发布于:福建省东启网提示:文章来自网络,不代表本站观点。