开始记录更多:一个新博客页

作者:李冠林 感悟

(更新于2023.1.1,22:36)在作者旁添加博文关键词,在正文中添加


1. 前奏曲

我的朋友知道我很喜欢音乐,正在努力成长为一个深刻的音乐欣赏家;这里如果有前奏乐曲的话,我希望能播放最近刚听到的一首来自琼尼•米歇尔的《Both side now》,这个YouTube的版本由我很喜欢的一位指弹艺术家Emil Ernebro编曲,不过原曲歌词更有哲学意义。

2022年4月11日完成学位论文答辩,虽然已经打算去工业界,却又开始在学术与非学术路线上思考与纠结。7月28日入职JD,开始管培生轮岗的旅程,至今天也快一个半月,曾同好友所说的“在工业界做学术研究的奢侈性[a]在今年的行业大环境中体现得淋漓尽致。脱离了毕业压力的我,在这几个月的经历中,也渐渐地开始从认知上跳脱出之前的矛盾。长期来看,阶段性的选择可能不会引发蝴蝶效应,长期追随的内心思想、信念与人生态度会引导某种路线。不过,就像层次生成式模型[1]一样,具体耕耘的“场”可能会随着外部环境的变迁而变化,但是内在的精神特质是始终如一或缓慢变化的。

这篇博文剩下的内容主要分为下面两个部分:

  1. 首先,我想从务虚的角度简单陈述一下自己的长期目标;
  2. 其次,会主要聊聊开启新博客的动机。

2. 长期目标

就在一个月前,我可能还根本没有勇气去谈论这个话题,因为没有用心去想过这个问题。如果你是读者,你此刻被问及“你有长期目标么?如果有都有哪些?”时,你能如数家珍般讲述出来么?博文写到这里,我开始尝试把最近的关于这一问题的一些思考汇总一下,尽量简洁、清晰地写在下面:

  • (G1) 长期看,我希望能写一些小册子,以知识、认识与经验的客观或主观的形式传播甚至传承,激励、影响更多人。

上面G1可能有许多具象的实现形式,例如:

  1. 写数据驱动场景下的关于可解释性方法、模型,以及分析方法的归纳整理与方法的发展的小册子;
  2. 写解构神经机器翻译发展历程的小册子;
  3. 写物流、供应链场景下数据驱动的全链路优化思路、方法,关键问题与解决方案的小册子;
  4. 写吉他、乐曲和声分析的系列短文;
  5. ……

另一个较为基础的长期目标是:

  • (G2) 长期看,我希望能够完善与丰富自己的数学成熟度[2]与学科认知。

上面G2也会有许多具象的里程碑,例如:

  1. 增强线性代数、概率统计、数学分析这类奠基性学科知识;
  2. 增强数学建模、算法设计与分析能力;
  3. 掌握基本的人类学、社会学、经济学知识;
  4. ……

最后一个或许是最为长期的目标是:

  • (G3) 长期看,我希望能够做一项改善甚至改变教育、科学研究、地球环境、医疗健康、高龄关怀等行业现状的长久项目。

这个长期目标可能有些不着边际,因为这不是一个人能决定的,但这或许是需要一个人去开启的吧。当然,我相信世界上已经有许多人正在这类事业上耕耘着,例如在AI领域的吴恩达等人之于教育,Yoshua Bengio等人之于气候变化。如前面的G1与G2一样,G3可能会具体体现在一些创业项目上:

  1. 教材、题库数字化到线上教育与精准教育:通过历史错题采集与学生画像构建,结合大规模题库,为学生设计精简且有效的知识学习与习题巩固路线,让教育更高效;
  2. 在文献索引网络(Google学术)基础上,搭建引用原因汇总、分析、提炼等应用,更方便研究人员在快速增长的大量文献中捋清楚所关注的主线研究脉络;
  3. 宣传、推广极简主义生活:对极简生活提供供应链支撑,搭建低碳、低消耗的生活方式与生活必需品消费链条;
  4. 搭建最值得信赖的医疗健康问答平台,从可靠信息的提供上严格把关,为病人提供易懂且权威的医疗科普咨询服务;
  5. ……

关于G3,上述罗列的4条陈述可能存在缺乏行业实践的幼稚与天真,请各位读者朋友谅解。我希望在未来的学习认识过程中,有更深刻且有效的想法出现。

3. 开启新博客页

说罢长期目标,最后再谈谈开启新博客页的动机吧。我同样试着简洁地罗列一下:

  1. 为了实现G1与G2,新博客是思考与实践过程的记录与缓冲区;
  2. 我喜欢内容创作,喜欢写文字语句与段落时的幸福感,正因为如此,才会有G1,G1是全然关乎内容创造与产出的;

新博客页的内容应该会涉及:

  1. 关于\(\epsilon\)’s Knowledge Vault的所有内容更新的前一个口语化或更随意的版本;
  2. 关于ml-better-understood的所有内容更新的前一个口语化或更随意的版本;
  3. 有价值的实验或实践探究的报告;
  4. 我认为有趣、有意义的论文的笔记;
  5. 生活、音乐的随笔;
  6. 工作、行业的随笔;

因为我会根据不同受众在中文协作和英文写作中来回切换(例如偏随笔的时候用我的母语中文写,偏专业性的时候用英文写),但又希望用某一语言写作的内容能同样有另一语言的版本,我会使用自己训练的神经机器翻译模型对中文或英文内容进行翻译,将其直接作为另一语言内容的同步。

因为我博士阶段主要做神经机器翻译这块的研究,但那时候的研究更多偏向于神经机器翻译框架的可解释性,通过我自己训练的模型进行内容产出这一形式可以辅助我加深对神经机器翻译应用能力的认识,特别是在持续学习[3]场景下如何遗忘与学习“新知识”。

注. 通过对翻译内容进行人工编辑,可以搜集后编辑数据,从而作为训练语料。

另外,我希望博客文章能打上标签,方便做分类,这可能需要对原始的Jekyll模板进行修改,这方便问题会尝试在后面的日子里找机会解决。

4. 尾声

最后,以最近在微信读书上阅读的李小龙所写的《生活的艺术家》前言中的话做结尾吧:

“我无法教你什么,只能帮助你探求你自己。除此之外,别无他法。”——李小龙

希望每一个人都能在生活中有艺术家的一面,探寻自我,达成所愿。

参考文献

[1]. Bayesian hierarchical modeling, Wikipedia.

[2]. Mathematical maturity, Wikipedia.

[3]. Continual Lifelong Learning with Neural Networks: A Review, arXiv.v4 Feb. 11 2019.

脚注

[a]. 我的一位好友说,这里应该改为“在工业界自由自在地做学术研究的奢侈性”。