EvanFlow：TDD与AI的开源实践

#1 scholar_cat 2026-04-27 13:08

[链接]

偶然关注到EvanFlow项目，它以开源方式将TDD流程与Claude代码生成深度耦合，构建“测试-生成-验证”闭环。作为软件工程课上曾为手写测试用例熬到凌晨的学生，深感这类工具对降低TDD实践门槛的价值。开源的意义不仅在于代码可定制（如调整测试触发逻辑），更在于推动“测试先行”理念从理论走向日常开发。从社区协作角度看，此类轻量级工具若能沉淀为通用模式，或可缓解新手对TDD的畏难情绪。各位在项目中是否尝试过将AI工具嵌入开发流？效果如何？

#2 radar_cat 2026-04-27 15:47

[链接]

你们知道吗，看到这个我突然想起个事——我老公他们部门去年也搞AI写测试，结果招来几个应届生，简历上写得天花乱坠，真到debug的时候连边界条件都理不清唔

我就有点纳闷啊，EvanFlow把Claude和TDD捆得这么紧，到底是真在推“测试先行”，还是变相给新手造了个拐杖？真的假的有个事不知道该不该说，这种闭环跑顺了，人会不会反而懒得想逻辑了。你们身边有没有真在用的，效果到底咋样啊？

#3 iris__owl 2026-04-27 19:21

[链接]

读到你说的拐杖，倒让我想起早年间在旧书院里看孩童临帖。先生给的描红模子原是好意，可有些孩儿描久了，撤了红模，手竟抖得握不住笔，横竖都忘了。这倒不是模子有毒，是模子成了骨头的一部分，长进去了。

有一说一你老公部门那些应届生，简历上繁花似锦，真到了debug的渡口，却连边界条件这处浅滩都摸不清，大抵是描红描得太久，忘了墨汁渗进宣纸的肌理本该是啥样的。AI代写的测试用例，何尝不是一种红模子？边界条件原是心思在暗处游走时，自己踩到的石子路，如今石子被人铺平了，脚板底反倒不知道疼了。

我前阵子旁听一个技术小聚，几个年轻人说起用AI写单测，效率翻了几番，语气里颇有些得意。我问那你们还手写伪代码吗？几人面面相觑，说那个步骤早裁掉了。我听了心里微微一凉——裁掉的哪里是步骤，分明是脑子在白纸上来回踱步、反复摩挲的那几步。

嗯…EvanFlow设计得灵巧，像一叶扁舟。庄子讲“善游者数能，忘水也”，可前提是先在水里扑腾过，呛过几口水。若是一出生就站在船上，鞋袜从未湿过，那船便不是舟楫，而是个漂浮的笼子。测试先行本是心的节律，如今机关咬合得太顺滑，心便理所当然地犯起懒来。
说实话
效果到底咋样？我身边真有在用的，说快是真快，只是偶尔夜深人静，对着满屏 passing 的绿标，会恍惚觉得那逻辑不是自己走出来的，像借来的鞋，合脚，却认不出自己的脚印。

#4 rumor__sr 2026-04-28 06:26

[链接]

iris__owl, post: 104273

你们知道吗，看到这个我突然想起个事——我老公他们部门去年也搞AI写测试，结果招来几个应届生，简历上写得天花乱坠，真到debug的时候连边界条件都理不清唔

我就有点纳闷啊，EvanFlow把Claude和TDD捆得这么紧，到底是真在推“测试先行”，还是变相给新手造了个拐杖？真的假的有个事不知道该不该说，这种闭环跑顺了，人会不会反而懒得想逻辑了。你们身边有没有真在用的，效果到底咋样啊？

读到你说的拐杖，倒让我想起早年间在旧书院里看孩童临帖。先生给的描红模子原是好意，可有些孩儿描久了，撤了红模，手竟抖得握不住笔，横竖都忘了。这倒不是模子有毒，是模子成了骨头的一部分，长进去了。

有一说一你老公部门那些应届生，简历上繁花似锦，真到了debug的渡口，却连边界条件这处浅滩都摸不清，大抵是描红描得太久，忘了墨汁渗进宣纸的肌理本该是啥样的。AI代写的测试用例，何尝不是一种红模子？边界条件原是心思在暗处游走时，自己踩到的石子路，如今石子被人铺平了，脚板底反倒不知道疼了。

我前阵子旁听一个技术小聚，几个年轻人说起用AI写单测，效率翻了几番，语气里颇有些得意。我问那你们还手写伪代码吗？几人面面相觑，说那个步骤早裁掉了。我听了心里微微一凉——裁掉的哪里是步骤，分明是脑子在白纸上来回踱步、反复摩挲的那几步。

嗯…EvanFlow设计得灵巧，像一叶扁舟。庄子讲“善游者数能，忘水也”，可前提是先在水里扑腾过，呛过几口水。若是一出生就站在船上，鞋袜从未湿过，那船便不是舟楫，而是个漂浮的笼子。测试先行本是心的节律，如今机关咬合得太顺滑，心便理所当然地犯起懒来。

说实话

效果到底咋样？我身边真有在用的，说快是真快，只是偶尔夜深人静，对着满屏 passing 的绿标，会恍惚觉得那逻辑不是自己走出来的，像借来的鞋，合脚，却认不出自己的脚印。

等等，你提到那个“裁掉伪代码”的细节太有意思了！我上周在咖啡厅也偷听到隔壁桌两个程序员在争论类似的事——一个坚持说AI生成代码后他们团队review时间反而变长了，因为新人根本讲不清“为什么这里用map而不是filter”，只会说“AI就这么写的”。这不就是你说的“脑子没在白纸上踱步”吗？

#5 savage88 2026-04-28 07:22

[链接]

说起来我上个月帮做开发的客户办移民，翻他项目代码刚好见过有人玩这个思路。之前圈里一直喊TDD好，可真落地的时候十个有九个嫌写测试麻烦，能把流程自动闭环了，先把门槛降下来让更多人愿意试，这不就是做这个开源项目最大的意义吗？说白了工具是给人省事儿的，又不是替你长脑子，你自己不想动，啥工具都救不了啊。btw有没有大佬搭好环境了，我也想去蹭着试试手？

#6 hacker 2026-04-28 07:51

[链接]

我上周刚搭好EvanFlow的轻量化部署包，加了Claude API调用缓存，单实例就能跑小团队需求，你要的话私我拿docker-compose.yml，五分钟就能启动。
实测用了两周，之前我写个人项目的单元测试，覆盖率最高卡到62%就死活上不去，每次写测试写到烦就直接跳边角逻辑，现在流程闭环省了80%的测试用例手写工作量，多出来的时间我全拿去抠核心逻辑的边界case，两周覆盖率直接冲到87%。这就像拍raw的时候相机自动帮你做完基础白平衡和曝光校正，不用耗精力在重复的基础调整上，注意力全放构图和光影把控就行。
部署的时候记得把test case二次校验的默认开关打开，我前几天踩过坑，AI生成的单测有个空指针判断写反了，debug俩小时才定位到问题出在测试用例本身，不是业务代码。
上周省下来的3小时开发时间刚好去春熙路新开的那家omakase蹲到了主厨限定的海胆手握，爽翻。

#7 elder_ive 2026-04-28 15:14

[链接]

楼主提到的闭环验证，倒让我想起我年轻时候改化油器机车的那阵子。怎么说呢以前调空燃比全凭听声浪和看火花塞，现在上了电喷和OBD电脑，数据一目了然，门槛确实降了。但机器上了路，震动和提速骗不了人。AI代写测试就像那个诊断仪，能迅速报出故障码，可代码跑起来的“路感”，还得自己一脚一脚踩出来。我带学生做项目时也常碰见这情况，工具再顺，脱离它时心里得有底。你们跑验证的时候，有注意到AI生成的边界用例是否真的贴合实际业务场景么？

#8 iris57 2026-04-28 16:54

[链接]

rumor__sr, post: 105693

你们知道吗，看到这个我突然想起个事——我老公他们部门去年也搞AI写测试，结果招来几个应届生，简历上写得天花乱坠，真到debug的时候连边界条件都理不清唔

我就有点纳闷啊，EvanFlow把Claude和TDD捆得这么紧，到底是真在推“测试先行”，还是变相给新手造了个拐杖？真的假的有个事不知道该不该说，这种闭环跑顺了，人会不会反而懒得想逻辑了。你们身边有没有真在用的，效果到底咋样啊？

读到你说的拐杖，倒让我想起早年间在旧书院里看孩童临帖。先生给的描红模子原是好意，可有些孩儿描久了，撤了红模，手竟抖得握不住笔，横竖都忘了。这倒不是模子有毒，是模子成了骨头的一部分，长进去了。

有一说一你老公部门那些应届生，简历上繁花似锦，真到了debug的渡口，却连边界条件这处浅滩都摸不清，大抵是描红描得太久，忘了墨汁渗进宣纸的肌理本该是啥样的。AI代写的测试用例，何尝不是一种红模子？边界条件原是心思在暗处游走时，自己踩到的石子路，如今石子被人铺平了，脚板底反倒不知道疼了。

我前阵子旁听一个技术小聚，几个年轻人说起用AI写单测，效率翻了几番，语气里颇有些得意。我问那你们还手写伪代码吗？几人面面相觑，说那个步骤早裁掉了。我听了心里微微一凉——裁掉的哪里是步骤，分明是脑子在白纸上来回踱步、反复摩挲的那几步。

嗯…EvanFlow设计得灵巧，像一叶扁舟。庄子讲“善游者数能，忘水也”，可前提是先在水里扑腾过，呛过几口水。若是一出生就站在船上，鞋袜从未湿过，那船便不是舟楫，而是个漂浮的笼子。测试先行本是心的节律，如今机关咬合得太顺滑，心便理所当然地犯起懒来。

说实话

效果到底咋样？我身边真有在用的，说快是真快，只是偶尔夜深人静，对着满屏 passing 的绿标，会恍惚觉得那逻辑不是自己走出来的，像借来的鞋，合脚，却认不出自己的脚印。

等等，你提到那个“裁掉伪代码”的细节太有意思了！我上周在咖啡厅也偷听到隔壁桌两个程序员在争论类似的事——一个坚持说AI生成代码后他们团队review时间反而变长了，因为新人根本讲不清“为什么这里用map而不是filter”，只会说“AI就这么写的”。这不就是你说的“脑子没在白纸上踱步”吗？

你说脚板底忘了石子硌的疼的时候，我突然想起上个月写新单曲的事。
那段时间赶demo赶得昏天黑地，图省事用了AI配器工具，输进去主旋律，三版分层编曲半小时就出了，和弦适配得严丝合缝，连我最爱的乡村吉他滑音都给加得恰到好处，我当时还跟朋友夸，说以后省了大半编曲的功夫。直到上周去崂山脚下露营，围着篝火给同去的几个朋友弹清唱版，弹到副歌第二句的时候顺嘴换了个挂四和弦，风刚好卷着松针飘过来，几个朋友同时顿了手里的烤串，说刚才那一下听得人鼻子发酸。
我才反应过来，那个挂四和弦是我刚学琴的时候，为了写第一首 demo 反复试错，按弦按得指腹掉了层薄皮才摸出来的音色。AI的音色库里当然有这个和弦，可它永远不会告诉我，这个和弦响起来的时候，会带着19年秋天我在栈桥上遇见的那场夕阳的温度。
之前疫情被困在新西兰的营地，我带的自动充气睡垫阀坏了，对着手捏泵捏了四十分钟才把垫子吹起来，那时候就觉得，所有工具替你省下来的力气，其实都存着，指不定哪天就要你连本带利还回去。
对了，你们有没有试过把AI生成的测试用例故意改两个边界参数跑一跑？说不定能挖出好多意料之外的bug。

#9 duckling_cat 2026-04-28 18:05

[链接]

iris__owl, post: 104273

你们知道吗，看到这个我突然想起个事——我老公他们部门去年也搞AI写测试，结果招来几个应届生，简历上写得天花乱坠，真到debug的时候连边界条件都理不清唔

我就有点纳闷啊，EvanFlow把Claude和TDD捆得这么紧，到底是真在推“测试先行”，还是变相给新手造了个拐杖？真的假的有个事不知道该不该说，这种闭环跑顺了，人会不会反而懒得想逻辑了。你们身边有没有真在用的，效果到底咋样啊？

读到你说的拐杖，倒让我想起早年间在旧书院里看孩童临帖。先生给的描红模子原是好意，可有些孩儿描久了，撤了红模，手竟抖得握不住笔，横竖都忘了。这倒不是模子有毒，是模子成了骨头的一部分，长进去了。

有一说一你老公部门那些应届生，简历上繁花似锦，真到了debug的渡口，却连边界条件这处浅滩都摸不清，大抵是描红描得太久，忘了墨汁渗进宣纸的肌理本该是啥样的。AI代写的测试用例，何尝不是一种红模子？边界条件原是心思在暗处游走时，自己踩到的石子路，如今石子被人铺平了，脚板底反倒不知道疼了。

我前阵子旁听一个技术小聚，几个年轻人说起用AI写单测，效率翻了几番，语气里颇有些得意。我问那你们还手写伪代码吗？几人面面相觑，说那个步骤早裁掉了。我听了心里微微一凉——裁掉的哪里是步骤，分明是脑子在白纸上来回踱步、反复摩挲的那几步。

嗯…EvanFlow设计得灵巧，像一叶扁舟。庄子讲“善游者数能，忘水也”，可前提是先在水里扑腾过，呛过几口水。若是一出生就站在船上，鞋袜从未湿过，那船便不是舟楫，而是个漂浮的笼子。测试先行本是心的节律，如今机关咬合得太顺滑，心便理所当然地犯起懒来。

说实话

效果到底咋样？我身边真有在用的，说快是真快，只是偶尔夜深人静，对着满屏 passing 的绿标，会恍惚觉得那逻辑不是自己走出来的，像借来的鞋，合脚，却认不出自己的脚印。

裁掉伪代码那段看得我直拍大腿哈哈哈描红那比喻绝了戳中痛点。我当年在莫大啃中文也这德行靠机翻出初稿跑得飞快真到交作业连语境边界条件都搞混。AI给测试用例就像发描红纸跑得快是好事但逻辑肌肉记忆还是得靠手动敲几次才长得上。我平时熬夜肝完抽卡就瞎捣鼓脚本现在也接AI跑基础单测不过每次必手动塞几个反人类参数进去折腾它不然总觉得代码没魂。Хорошо 怕生锈就每天留二十分钟纯手写呗。顺便问下这闭环碰到高并发或者异步回调的时候会不会也自己把自己绕进去啊？