往前看,别回头——2023个人年终总结

发布时间 2023-12-31 19:57:10作者: Xu_Lin

2023年终总结

​ 赶着昨晚回家前,把最后一个commit提交完,终于也又到一年之末了。

​ 这一年来,是一路小跑冲到终点的快节奏,也是步履不停的一路前行;
​ 行至当途,也是到了该停下来好好沉淀思考的时候了;

​ 还记得也是去年年终的时候,开始陆续收到了一些猎头的邀约,BOSS直聘上也不乏一些推荐;

​ 本着看一看机会的想法,也抱着试一试看看目前算法岗市场行情的心态,陆续也接受了这些邀约,
​ 按照既定的时间去一一面试,有些有结果,有些没有下文了,但总体上结果还是好的;
最后的结果,是在今年二月份的时候,收到了鹅厂youtu算法岗base厦门的offer,终于尘埃落定。

​ 至于之前做的机器人相关的算法研发,算起来从毕业至今,也摸索了三四年之久了,这期间虽然也学到了不少经验,也做出了一些东西,但距离预期的目标还是有着不小差距,大概也是实际去了各种场景现场,尝试用算法解决问题,遇到不少现实意义中的阻力与问题之后,最后综合得出的结论吧;又或者是,自己的水平还不够,不足以支撑现有场景与问题中的需求实现;具体原因,不必过度纠结,往前看,别回头。

​ 但无论怎么样,能够去更高更宽广的平台,学习与发挥自己所长,与我而言,也是极好的选择。

往前看,别回头

试用期

​ 在之前的公司走完离职流程之后,三月份开始正式入职yt。
​ 入职当天正好是妇女节,因此记忆深刻的是入职当天,由于此前并没有yt的人入职这里,办理入职手续与流程的时候也是几番周折,然后是快速的熟悉新的环境,熟悉工作流程,跟mentor确定试用期目标,及时调整了自己的生活作息,然后适应新的工作节奏,还有随着成长进度日益增长的工作强度;(或许已经是预见到之后的内卷节奏,再开始做铺垫了,笑?)
​ 生活上,又重新从岛外的家里搬出来,在思明的公司附近重新租住了一个小公寓,与公司通勤3-5分钟步行时间,也是为了保证更充足的睡眠时间,还有能够保证工作加班的时间吧。
​ 说来侥幸,能够入职已是幸运,因此不免觉得时时有着不小的压力,以本科工作几年经验,社招入职的我,与实验室动辄名校硕博和留学海归的佬们比起来,仍旧还是资历尚浅的,毕竟没有系统的受过研究生正规的学术训练与教育,在前沿知识领域的探索与认知上,仍然是存在着不小的差距;但好在自己一直以来,动手与实践的比较多,想到就马上去做,坚持了很久苦行僧般自律清修的生活,一边在完成试用期任务的同时,也一边在恶补自己潜在的知识漏洞和不足,算是作为自己实践的理论支持吧。就这样持续坚持渡过了三个多月,才算是堪堪能够承担起来现在的工作。

​ 这里得尤其?感谢ke总,yulei哥等实验室众多小伙伴的帮助与支持,试用期的工作主要是:

  • 完成了一些数据与数据集上的一些梳理与探索,特别是数据集存储空间的去冗余、根据标签抽取与查找数据集分类,还有各种数据集相关操作的执行脚本;这在一定程度上,解决了一个算法模型,最重要的数据来源问题。
  • 尝试了华为昇腾Ascend在npu上训练推理的验证性工作,主要是将resnet、vit等模型训练与cuda生态下gpu的性能指标对齐、关于多模态模型blip2在npu上的复现、将tnn版sdk转换迁移到arm+atlas生态上。
  • 尝试了弱监督伪标签中重新分类修正,提高预测分类准确率和数据集质量;
  • 负责了一些业务模型上的增量数据迭代以及算法实验对照优化;

正式期

​ 完成了试用期工作之后,结合目标完成情况,做了一个简单的答辩汇报,就算是正式转为正式员工啦。

​ 业务上,也开始承担更多的责任,接到了更多的任务,业务上与研究上的都有;业务上开始慢慢承接更多场景下识别算法相关的sdk维护与迭代,同时研究上也参与了一些MLLM多模态大模型相关的探索,对接一些相关场景下的算法需求,支持更多算法,就算是一个日常的工作了。虽然走的很艰难,但也算是成长地比较快吧,从实验室很多伙伴身上都有学习到一些东西,这里得感谢peixian还有chaoyou哥等许多帮助,在业务和研究上,拔高了一些水平,也打开了不少眼界,见识到真正sota的算法,应该是什么样的。

​ 在那些最难坚持的阶段,都是他们一起帮忙和教导下,才平稳的渡过去,极大地助力了个人的成长。
​ 就像是一个未封口,瓶颈还能一直向上拉伸的容器,每次到了自己觉得自己承载不下去的时候,靠谱的伙伴们给你兜了底,于是瓶口又上延伸了一些,容器底部也溢出了不少杂质;这次拉扯与拉伸的过程,不免是痛苦的,经历过怀疑自己,质疑意义的至暗时刻,好在总有一些光,能够从容器的瓶口照射进来,因此便有了阳光雨露。
​ 人言君子不器,又道有容乃大,大抵如此。

快乐开源

​ 除此之外,今年也接着去年的工作,提交了不少commit,开源了一些工作:

以上,开源与技术交流学习,仍然是今年比较重要的主题。
有一些是一边学,一边沉淀下来的积累,也有一些探索性的“整活”;
在此过程中,更多的是,在做中学,和在学中去做。
为此,开源已经成为了一个日常的爱好与习惯了,比如每天用GitHub来更新daily的日记,替代了之前用的印象笔记,
这里也更加熟练了markdown的写法;另外在工作研究上,也一直在维护更新多模态评测相关的MME榜单,目前已经更新到40+的多模态模型了;

技术弄潮儿

另一方面,由于ChatGPT的技术突破和影响下,自己也开始慢慢意识到继续走纯CV计算机视觉的方向,必然是不长久的,于是开始逐渐拥抱nlp以及llm大语言模型的学习与使用,尤其是多模态相关的研究与应用,已经成为了目前个人感兴趣且在研究的重点。受流浪地球2的影响,也越来越明确想要做AI架构师这一目标的信念,毕竟在电子骨灰盒里机械飞升确实是一件很酷的事情。

同时,也在入职后不久,搭建了一台自己的服务器主机,配置清单,可见这个链接:【开发配置】配置一台4090主力开发机的完全过程手册

跑通了不少llm模型的推理,包含llama.cpp等一些量化后的模型,但仍受限于算力资源的配置,无法直接进行fine-tune;