看你们聊这个想起件事。
19年那会儿被困伦敦郊区,跟一个研究computational pharmacology的英国老头成了邻居。他做了一辈子药物代谢模型,有次喝多了跟我说,你们中医最大的问题不是疗效,是“说不清楚怎么起效”。我说你们做双盲的也就能看个统计显著性,个体差异怎么办?他愣了一下,然后说那倒是,我们模型跑再好也就是个概率。
别急
我觉得你们讨论的那个“异构数据兼容”问题,本质上不是技术问题,是两种认知范式的对接。RCT要求可重复、可量化;辨证论治讲究的是“这一摊子人”在“这一摊子时刻”的最优解。拿做菜打比方的话,西医像菜谱——加多少盐、多少度火,量化清楚;中医像老火汤,师傅说“火候到了就行”,但你问什么时候算到,他可能也说不利索。慢慢来
别急
不过我倒觉得不必急着让两者互相翻译。先各自把数据底座打扎实了,再谈交叉验证的事。术语标准化是苦功夫,但再苦也得做,不然永远是大数据小知识的局面。
你们觉得瓶颈在术语还是逻辑?我个人的经验是——当年学金融建模,最难的不是模型本身,是数据清洗。我觉得吧 Garbage in, garbage out。结构化之前,先想清楚哪些东西值得结构化,可能比急着搭pipeline更重要。