如何从传统软件开发顺利过渡到互联网技术开发

今天来说一个比较普适性的问题：如何从传统软件开发转到互联网技术开发，这也是不少朋友问过我的问题，特整理一篇文章出来分享给大家。

软件无所谓传统与新兴，只不过面向市场的不同，导致大家心里有个对比。何谓传统软件开发，可能更多的与企业内部应用挂钩，采用项目制，人员对项目负责，面向B端用户，用户规模小，业务场景特定，迭代升级频率小，技术实现复试度较互联网应用低。

由于采用项目制，在项目结束后，项目就移交出去，后期的升级、维护、运营、运维几乎很少参与，日常开发工作更多的也仅是业务开发，导致参与这些项目的人员成就感特别低，技术成长有限。有一个词与传统软件开发走的比较近：外包。所谓铁打的项目，流水的码农，外包人员的流动性是最大的。

那为什么要跳出传统软件开发，去做互联网研发呢？说到底还是生存与发展的问题。BAT，TMD等类似大厂的好待遇好福利好前途，充斥着互联网，影响着身边的每一个人。短短数十年的信息革命又被称为第四次工业革命，远比之前三次来的更迅速，渗透的更深入。互联是趋势，我们要做的就是顺势而为「这让我想起雷总牵头的顺为资本」。

切入正题，不管做什么转到哪行做研发，无非两方面，软实力加硬技能，再具体点就是思维转变结合一定的技术储备。

软实力——思维转变

就是变被动为主动，沟通协调，团队合作，都需要一个转变。举个栗子——需求，不能再一味的按着合同上确定的需求，按部就班一个里程碑接一个里程碑的去实现，有需求变动再去做个需求变更流程后再开发功能。

上篇文章专门介绍了做项目与做产品时的需求区别：产品需求与项目需求的差异。需求是一个转变点，其它还体现在开发模式、产品迭代、团队合作中。互联网研发更多的趋向于产品研发，开发模式抛弃传统软件开发过程中的瀑布模型，更多的采用敏捷模式，KANBAN、SCRUM等，读一下敏捷宣言似乎来的更直观一下。

个体和互动 高于 流程和工具 

工作的软件 高于 详尽的文档 

客户合作 高于 合同谈判 

响应变化 高于 遵循计划

大家都在讲互联网思维，做研发也一样，只有从 自我认知层面转变过来，才能更好的去适应互联网技术开发。

有人说我一直搞传统开发，没有经验啊！其实方法总比困难多，去找从事过相关工作的同学\亲戚\朋友\前同事\网友去聊聊天，到知乎\Google\微博\博客\公众号看别人的总结，参加相关的线上线下活动等等，如果以上都不行的话就来找我吧。

硬技能——技术储备

以结果导向看，因面向对象的不同，导致采用的技术栈差异比较大。互联网应用技术应用更广泛，更考验技术的融合能力。具体有哪些不同，从招聘网站的相关岗位技能要求上就能找到端倪。你需要做的，就是找几个代表性的技能要求摘出来，形成自己的技能学习列表，个个击破。特别是一些常见的，比如分布式、缓存、消息队列等。

肯定有朋友跳出来说我工作中压根都用不到，怎么能掌握住。工作中用不到，只能在工作外想办法，自己啃书看教程学习，照猫画虎做案例；跟别人交流取经，探明暗坑深水，为我所用。

为什么要转型呢？

云计算的盛行，导致很多产品已经云化。另外，长期专注于业务开发导致技术人员自觉乏味，没有提升空间，自我存在感、成就感大幅下降，而互联网、移动互联网、物联网、大数据、人工智能等一波又一波的浪潮，一个又一个造富神话，充满了吸引力，并且有很大的成长空间。

本文也是基于前文的基础上，从一些简单的点入手，引入一些经常用到的开发技能点。从单体应用开发，过渡到分布式应用开发，技术栈的变更必然导致学习、工作上产生不小的变化，以下列出几点，来帮助想要转型的朋友掌握这些技能，以便更好的融入到新团队中去。

分布式通讯技术

单体应用几乎不涉及到系统间的交互，或者有些通过老旧的WebService的形式进行交互，互联网分布式系统倾向于采用轻量化的、更高效率的通讯方式，比如基于HTTP、RPC协议等，了解基本的原理才能更好的使用它们，常见的，再掌握所以你应当掌握一些常用的分布式框架，比如常见的Apache Dubbo,Spring Cloud,Google gRPC等等。数据交互的格式以有轻量的JSON替代原先比较臃肿的xml格式。

缓存技术

缓存可谓是提高应用效率的大杀器，在互联网产品应用非常广泛，掌握几个常见的缓存中间件是很有必要的。也很多应用场景中，也只能缓存才能保证应用的完整性，比如秒杀场景。缓存按应用场景也有区分，如本地缓存EHcache,Guava等，分布式缓存Redis，Memcache，hazelcast等等。

非结构化数据存储

互联网产品更多会产生一些碎片化的数据，且没有严谨的数据结构，这些些场景上采用非结构化存储势在必行。根据不同的数据类型，还可以细化分为不同的NOSQL库，比如说文档数据库（MongoDB等)、KV库（Redis，LevelDB等）、图库（Neo4j)、列数据库（Hbase等）、搜索引擎（Solr、ElasticStack等）。

异步、多线程技术

同步的一问一答，能比较及时的处理业务，但当业务量大的时候，为提高系统可用性、处理效率，往往会进行异步、多线程方式进行处理。线程池技术，高并发编程显的尤为重要。

消息中间件

MQ天然具有系统解耦的优势，应用场景也比较丰富，如在分布式事务中作为中间办来协调事务、统一的消息（APP推送，短信等等）推送分发、延迟队列，特别是在高并发高承载的情况下进行削峰平谷，缓解系统压力。比较常见的RabbitMQ、ActiveMQ、RocketMQ、ZeroMQ、Kafka等等。

分布式事务

单体系统的事务很容易控制，当系统扩展为很多个子系统时，事务会分面在各个子系统中，只有保证分布式事务的准确性，才能保证数据的完整性。目前现在很通用的分布式开源解决方案比较少，大家都在采用自己的方案在做，阿里最近开源的Fescar是一个比较有潜力的方案，还有华为的SAGA方案等等。

安全开发

安全开发在所有系统中都存在，只不过传统的单体应用开发，特别是外包行业，基本很少考虑。而互联网产品面向大众，所以网络安全、数据安全更为关键，比如常见的XSS攻击、CSRF攻击、撞库、拖库等等，都需要在开发、测试、运维过程中重点关注。OWASP TOP 10或CWE top 25都有比较详细的描述，可以关注下。

运维层面

Linux常见的操作应当掌握，毕竟我们很多的服务器都是运行的x86架构下的Linux服务器中，即便是不同的分发版本，命令很多也是通用的。Devops文化已经不再陌生，开发&运维已经不可分割开来单独作业务，持续集成（CI）、持续部署(CD)技术将二者的边界变的更模糊，共生共存。

下面提几个高级进阶点，这些点并非必须要掌握，但后续肯定会遇到，技多不压身，有条件的话，可以适当的探索一二，扩展眼界，提升格局。

链路追踪技术

单个系统里的日志可以按系统交互的先后顺序输出，单系统分拆后，系统日志分别存在于各个子系统中，再区分请求的先后顺序难度就比较大了，导致追踪定位问题，比较繁琐复杂。还好Google又一次引领了潮流，Dapper论文的出现，催生出一大批开源组件的出现，Zipkin、Pinpoint、CAT等应用比较广泛的几个。

集群部署

听起来比较搞大上，无非是将原来一台机器干的事，分散在不同机器执行而已，对外提供较高的可用性、计算能力。对于每个用到的中间件几乎都会有主从、主备、集群、高可用等部署策略。

高可用技术

与集群技术应该是关联性很大的，更多是来应对单点故障，简写称为HA（High available），比如可能会经常用到keepalived来保证Nginx、Apache、Tomcat的HA策略；比如会用到Supervisor来保证某些进程挂掉后，自动拉起。

容器技术

Docker应用的普及，将云原生应用的提到前所未有高度。Kubernate等容器编排工具更加快了云原生应用（Cloud Native）的普及，CNCF孵化下的各种开源中间件也为业务提供了强大的技术支撑。

由于传统软开发过程中较少的涉及到如上一些技术点，所以需要在工作之余进行练习掌握，这对后续的面试求职也有很大的帮助。没有工作场景，就没有掌握相应的技术，没有相应的技术支撑，就没有机会进入互联网行业，毕竟很多公司都是希望你来就可以上手产出价值，而不是培训一两月时间再上岗。