2023年终总结

赶着昨晚回家前，把最后一个commit提交完，终于也又到一年之末了。

这一年来，是一路小跑冲到终点的快节奏，也是步履不停的一路前行；
行至当途，也是到了该停下来好好沉淀思考的时候了；

还记得也是去年年终的时候，开始陆续收到了一些猎头的邀约，BOSS直聘上也不乏一些推荐；

本着看一看机会的想法，也抱着试一试看看目前算法岗市场行情的心态，陆续也接受了这些邀约，
按照既定的时间去一一面试，有些有结果，有些没有下文了，但总体上结果还是好的；
最后的结果，是在今年二月份的时候，收到了鹅厂youtu算法岗base厦门的offer，终于尘埃落定。

至于之前做的机器人相关的算法研发，算起来从毕业至今，也摸索了三四年之久了，这期间虽然也学到了不少经验，也做出了一些东西，但距离预期的目标还是有着不小差距，大概也是实际去了各种场景现场，尝试用算法解决问题，遇到不少现实意义中的阻力与问题之后，最后综合得出的结论吧；又或者是，自己的水平还不够，不足以支撑现有场景与问题中的需求实现；具体原因，不必过度纠结，往前看，别回头。

但无论怎么样，能够去更高更宽广的平台，学习与发挥自己所长，与我而言，也是极好的选择。

往前看，别回头

试用期

在之前的公司走完离职流程之后，三月份开始正式入职yt。
入职当天正好是妇女节，因此记忆深刻的是入职当天，由于此前并没有yt的人入职这里，办理入职手续与流程的时候也是几番周折，然后是快速的熟悉新的环境，熟悉工作流程，跟mentor确定试用期目标，及时调整了自己的生活作息，然后适应新的工作节奏，还有随着成长进度日益增长的工作强度；(或许已经是预见到之后的内卷节奏，再开始做铺垫了，笑?)
生活上，又重新从岛外的家里搬出来，在思明的公司附近重新租住了一个小公寓，与公司通勤3-5分钟步行时间，也是为了保证更充足的睡眠时间，还有能够保证工作加班的时间吧。
说来侥幸，能够入职已是幸运，因此不免觉得时时有着不小的压力，以本科工作几年经验，社招入职的我，与实验室动辄名校硕博和留学海归的佬们比起来，仍旧还是资历尚浅的，毕竟没有系统的受过研究生正规的学术训练与教育，在前沿知识领域的探索与认知上，仍然是存在着不小的差距；但好在自己一直以来，动手与实践的比较多，想到就马上去做，坚持了很久苦行僧般自律清修的生活，一边在完成试用期任务的同时，也一边在恶补自己潜在的知识漏洞和不足，算是作为自己实践的理论支持吧。就这样持续坚持渡过了三个多月，才算是堪堪能够承担起来现在的工作。

这里得尤其?感谢ke总，yulei哥等实验室众多小伙伴的帮助与支持，试用期的工作主要是：

完成了一些数据与数据集上的一些梳理与探索，特别是数据集存储空间的去冗余、根据标签抽取与查找数据集分类，还有各种数据集相关操作的执行脚本；这在一定程度上，解决了一个算法模型，最重要的数据来源问题。
尝试了华为昇腾Ascend在npu上训练推理的验证性工作，主要是将resnet、vit等模型训练与cuda生态下gpu的性能指标对齐、关于多模态模型blip2在npu上的复现、将tnn版sdk转换迁移到arm+atlas生态上。
尝试了弱监督伪标签中重新分类修正，提高预测分类准确率和数据集质量；
负责了一些业务模型上的增量数据迭代以及算法实验对照优化；

正式期

完成了试用期工作之后，结合目标完成情况，做了一个简单的答辩汇报，就算是正式转为正式员工啦。

业务上，也开始承担更多的责任，接到了更多的任务，业务上与研究上的都有；业务上开始慢慢承接更多场景下识别算法相关的sdk维护与迭代，同时研究上也参与了一些MLLM多模态大模型相关的探索，对接一些相关场景下的算法需求，支持更多算法，就算是一个日常的工作了。虽然走的很艰难，但也算是成长地比较快吧，从实验室很多伙伴身上都有学习到一些东西，这里得感谢peixian还有chaoyou哥等许多帮助，在业务和研究上，拔高了一些水平，也打开了不少眼界，见识到真正sota的算法，应该是什么样的。

在那些最难坚持的阶段，都是他们一起帮忙和教导下，才平稳的渡过去，极大地助力了个人的成长。
就像是一个未封口，瓶颈还能一直向上拉伸的容器，每次到了自己觉得自己承载不下去的时候，靠谱的伙伴们给你兜了底，于是瓶口又上延伸了一些，容器底部也溢出了不少杂质；这次拉扯与拉伸的过程，不免是痛苦的，经历过怀疑自己，质疑意义的至暗时刻，好在总有一些光，能够从容器的瓶口照射进来，因此便有了阳光雨露。
人言君子不器，又道有容乃大，大抵如此。

快乐开源

除此之外，今年也接着去年的工作，提交了不少commit，开源了一些工作：

有跟学术相关的，针对模型评估绘图的：
https://github.com/isLinXu/model-metrics-plot
有跟大模型prompt学习相关的：
https://github.com/isLinXu/model-metrics-plot
有跟模型推理UI相关的：
https://github.com/isLinXu/vision-process-webui
有跟模型探索相关的：
https://github.com/isLinXu/onnx-explorer
也有跟业务和yolo目标检测相关的：
https://github.com/isLinXu/YOLOv8_Efficient
以及学习路线图整理的：

https://github.com/isLinXu/awesome-road-map
用chatgpt回答知乎问题的，答案之书：

https://github.com/isLinXu/chat-question-book
... ...

以上，开源与技术交流学习，仍然是今年比较重要的主题。
有一些是一边学，一边沉淀下来的积累，也有一些探索性的“整活”；
在此过程中，更多的是，在做中学，和在学中去做。
为此，开源已经成为了一个日常的爱好与习惯了，比如每天用GitHub来更新daily的日记，替代了之前用的印象笔记，
这里也更加熟练了markdown的写法；另外在工作研究上，也一直在维护更新多模态评测相关的MME榜单，目前已经更新到40+的多模态模型了；

技术弄潮儿

另一方面，由于ChatGPT的技术突破和影响下，自己也开始慢慢意识到继续走纯CV计算机视觉的方向，必然是不长久的，于是开始逐渐拥抱nlp以及llm大语言模型的学习与使用，尤其是多模态相关的研究与应用，已经成为了目前个人感兴趣且在研究的重点。受流浪地球2的影响，也越来越明确想要做AI架构师这一目标的信念，毕竟在电子骨灰盒里机械飞升确实是一件很酷的事情。