新浪科技

Vancl后台系统成长记 专访凡客CTO崔晓琪

太平洋科技

关注

可以说现在的企业没有哪一家是能完全离开IT支撑系统的,尤其是一家互联网公司,从诞生之日开始就不可能离开自己的网络和服务器。而当企业规模上到一定程度时,这个企业就很有必要搭建自己的数据中心了。目前,网络上销售男装衬衣闻名业界的Vancl也许正处在这个转折的阶段。

从一套150平米的商住两用房、15名工作人员,到四层写字楼、800多名员工;从几百万的注册资金、日销量15件,到6亿元的年销售额、日销量超过4万件……这些数字其实也可以用不断增长的IT系统负载压力来详细解读。究竟凡客诚品Vancl是怎么从零开始搭建自己的IT业务支撑系统的,目前这个系统规模如何了,带着这些问题,PConline采访了凡客诚品的CTO崔晓琪先生。


凡客诚品CTO 崔晓琪先生

点击进入专访现场视频

创业阶段的量入为出

崔晓琪:Vancl最开始创业的时候网络架构、服务器这些方面都比较简单。最开始可能就一个两个机柜的设备。网络架构当时的设计也没有说能支撑很大的量,但是我们的业务发展越来越快,系统压力也就越来越大。

从07年10月份开始起步,到08年初的时候发展的速度就已经超出我们的想像。中间也出现过服务器性能承担不了的这么大的业务的时候,在08年6月份就曾有过一次这样的事故。因为08年6月是我们当年的一个业务高峰,网络架购的带宽问题当时承接不了这么大的业务压力。

从08年6月份逐渐开始。我们就不断的加大IT基础设施的投入。所以到现在我们在IT间有超过10个机柜。服务器大概有上百台。比刚开始的时候,规模大概扩张了10倍左右。我们现在也在考虑多个机房的建设。

所以这个IT基础设施的建设不是明年公司发展到什么时候我们跟进到什么程度。我们应该是至少能够支撑公司未来三到五年的增长,就是未雨绸缪。

细分业务系统的不断优化阶段

PConline:你们在定义IT信息系统如何辅助处理企业业务逻辑的时候你们是怎么考虑的,这个信息系统是自己团队从头开始开发呢。也会去找一些成熟的软件和平台来改造使用呢?

崔晓琪:我们现在所有的业务系统基本上都是自己开发的。一开始我们的库房很小,单数也很少。我们简单的一个程序比如对帐单的处理然后发货,就满足当时的业务需要了。但是随着业务数量不断的增长,我们现有的系统也是经过不断的优化。根据业务人员不断的业务需求来提出改进方案。那么这个是从业务数量增长和复杂度变化的角度不断变化的。我们至少现在能够看到我们自己开发的系统是最贴合自己需求的,而且我们也有能力自己需求的改变。

PConline:你们的系统我理解考虑的话应该有这么几个:一个它就是前台,前台它就是对网友订单服务。另外一个它就是有后台。后台就是你们上游的供应链、物流系统等,这是给你们的后勤和帐面管理这部分服务的。这两个系统它着重点是不一样的,后面这一系统它可能根据传统的管理软件,而前端的系统它变化很快,由其用户体验来不断改善。这两部分系统完全是由你们自己开发的?

崔晓琪:是的,前台系统基本上就是网站的一部分。包括网站编辑用的管理系统,怎么管理这个网站的内容。这些全都是我们自己开发的。刚才提到物流系统、仓储系统还有客服(数据库)系统全部都是我们自己开发的。

PConline:我们作为媒体,也经常会有那种体会。PConline的业务可能经常会去尝试一个新的业务的时候或都一个新的表现形式的时候,这个过程不可能把所有的事情都想清楚明白,那对开发技术团队来说这就是一个很恐怖的事情,就是说你的业务永远是处于变动当中的所以对于技术开发来讲他会受到很大的一个制约。而对业务需求方来讲也永远不会满足技术这边的速度。开发也需要一个周期,还需要稳定,还需要测试,这就进入一个很矛盾的循环。Vancl这边的情况是如何?

崔晓琪:这个情况确实是存在的。我们从08年开始就提出项目管理制度,就是项目经理负责制。项目经理来去跟业务部门去做需求沟通,从立项开始。要需求确立下来,由相关业务部门的签字。确立下来现在的需求是这样的。然后以后有变更的话也要有相当的文档去说明这个需求变更了。

这对业务部门也提出了很高的要求,因为业务部门的想法有时候表达起来其实是就是沟通的成本其实是很高的。这需要项目经理把业务要求描述成一个技术语言。他会把比如你是业务部门,你只要把你的想法说清楚。然后我来帮你把它变成技术比如说开发可以理解的这种东西,然后我还可以去帮助你去考虑说你没有想明白的问题,这个是Vancl对项目经理的要求。>>

互联网企业也有其传统部分

PConline:传统服装业这部分他们的触动点主要是在于平面的管理,什么样的产品考虑到什么时候什么周期投入到市场。然后上游应该找哪一家供应商,由谁来提供。他们处理的主要是这一些事情。

崔晓琪:其实他们做的大部分是跟供应商还有就是他们对产品的规划,和供应商联系做订单这些相关的工作。这和传统服装渠道企业是没有什么分别的。

PConline:03年在雅格尔采访的时候,当时中科院的一个领导在做雅格尔的信息系统,他说整个服务行业利润最大,同时也是损失利润最大的环节其实是在库存上,因为服装企业的大量库存,即使是小批量的快速补货,它的量还是要远远超过电子商务,电子商务的量有可能每个批次可能就是几件,如何从管理上降低这个各个订单的上游成本呢。

崔晓琪:比如我们在做一个新品,因为互联网的速度是最快的。传统服装业新品出来以后要去经销商铺货,最后到零售商。然后再慢慢的把数据一步步反馈回来。但是互联网不一样,新品出来以后,其实第一天就可以看到产品的大概的一个销量是什么样的,然后我们就会估计到在这一季或在这一个周期之内大概会有多少销量。考虑我们的订单量是不是够,如果不够的话我们就要即时的去补货。

这个反馈的速度肯定是要比传统服务业要快很多。但是也像你说可能我们不会像他们一开始量就做那么大,但是一旦是我们看准的产品的话。我们的量是非常大的,比如说我们基本款的这种POLO 、T恤这一个夏季会卖100多万件,我们看准的产品在短周期内的量也会超过传统服装业。

PConline:理论上讲反应速度确实能决定结果。供应链各个环节的反应速度其实是不一样的,比如说上游去订布料,然后安排生产力,他的生产力在旺季的时候未必就合适,数据到达上游时候,终端的需求也许已经发生改变。

崔晓琪:供应链管理不管是传统还是互联网电子商务的企业来讲都是很重要的,我们这边可能会有象你说的这种问题就是说可能不会说象超市的产品一样发补货会那么快,但是我们会有一些方法,比如说我们先把面料准备好,因为面料是不会象做成成衣一样就浪费了的,等卖不出去了就是库存,面料我们会准备相对较多的。因为以后还会再用,然后我们尽量的缩短供应链的时间,对于强势产品来讲我们尽量缩短时间,达到尽量满足客户的需要。

供应链管理这块Vancl是刚刚开始起步,就是说现在我是主要跟供应商采购,管理系统方面还没有将所有供应环节纳入其中。可能在明年会把供应商整个管理平台做出来,让供应商可以在一个系统中看到货品现在是处于一个什么状态,他是不是需要补货或者怎么跟供应商对帐,这些功能都要在这个平台上实现。

PConline:那就有点像沃尔玛一样,它的供应商实际上是可以看到每天销售情况,然后还可以看到它在每个地区每个门店的销售情况,这样就可以随时调配商品流通。那Vancl的运营是全国性销售,你们的库房管理是怎么一个情况呢?

崔晓琪:Vancl目前是三地库房,北京、上海、广州。这种库存模式基本是比较大的电子商务公司比较普遍的模式,就是集中在发达城市然后散发周边地区。多地库房的管理是电子商务必须的,因为你要提供更快的响应速度你就必然要做这件事。这个系统也是我们自己开发,从前台下订单以后来自动转到后台数据库中,同时系统会根据客户填的地址,由系统自动判断由那个库房来发货的速度最快,成本最低。

PConline:另外一个问题就是用户体验,用户体验表面上看起来跟用户打交道的界面无非就是网站、页面,这是一个最直观的。另外一个可能客服的服务态度,然后还有就是的配送时效,它也是一个跨部门的完整链条过程,对客户来讲它是一个完整的周期用户体验,我不知道比如说象Vancl这么复杂的业务模式,改善用户体验过程技术部门会以什么角色参与其中。

崔晓琪:目前来讲呼叫中心是接到用户的投诉的第一点,我们每周都有呼叫人员把这周客户的投诉比如说哪几类问题投诉会比较多,告之大家,然后所有部门如果是对自己部门相关的,它就会考虑我们怎么样来解决这样的投诉,如果是大规模的投诉就会及时的反馈给大家,然后考虑出一个解决方案,怎么来给客户解决他们遇到的问题,这一点可能是所有的投诉都聚集到服务中心这边来,那么还有一部分,我们现在有专门的客户体验的部门,他们可能更多的考虑角度来考验Vancl网站视觉和购物流程。还有就是从配送这一块怎么做能让客户满意度更高,它这个用户体验小组完全就是扮演客户,他们挑网站的毛病挑公司的问题,怎么样来让客户体验更好。这个是我们正在做的。>>

向着技术公司方向前进的Vancl

PConline:就是我为什么问上面的问题呢,就是包括亚马逊,甚至阿里巴巴他们都做了平台转换,同样他们大部分应用都是自己开发的,最开始实际上是做为技术的平台,逐渐把它的开放技术平台的封装为技术标准服务拿出来,然后跟很多的网站签了应用服务进行对接协议,发展到现在他们其实是一个完完全全的技术公司。象阿里巴巴或者是叫亚马逊,它们是为计算方面提供服务,象这方面转化的时候呢,它其实最强大最强大的就是在电子商务技术领域。

那比如说我可以在亚马逊上卖衣服,也卖数码产品,甚至卖汽车或者卖其它的商品,它有完全不同的业务模式,但是最大的特点就是它的技术成本比企业单独自己去开发平台要便宜很多。第二个就是说它对整个电子商务业务领域从技术角度它有它的理解,就有点象我们看SAP软件用在了汽车制造也用在了快速消费品行业的零售,它有很多行业的差别,所以这个是不太一样。就是我不知道像你们公司的发展方向,比如最后Vancl只是一个卖衣服的公司?还是最后会做成一个技术公司?

崔晓琪:这个架构也就是SOA架构,就是面向服务架构。我们内部的这些体现都是业务系统都封装在服务里面,然后开放接口,其实这也是亚马逊和淘宝他们都做的事情。

其实Vancl刚创业的时候无所谓什么架构可谈,就是为了把业务推上线,就是按照传统结构化来分层,能实现业务就好。后来我们发现这样做越做会混乱,系统没有什么维护性和可扩展性而言,我们马上一步一步的开始,趁他现在还没有发展到我们负担动不了的时候,我们就一步步的把它分装成SOA的架构。这样以后的扩展性,只要添加机器就好,就是不同的服务,如果说这个服务压力大,那么我们就加机器就好,新的机器会不断的提供系统的计算能力,这也是SOA的优势之一。

PConline:您刚才说08年6月曾经出现过系统过载的事故,系统的改造是经过那个以后吗?

崔晓琪:从那个转折点以后,我们IT技术基础架构会有一个重大的转变。真正的规范起来。从软件开发来讲也是把他的架构做起来就是我们用SOA的架构,不管说是以后我们自己扩展还是说做成第三方平台也好,都是有非常大的好处的。

PConline:另外一个考虑机器是相对便宜的,开发是相对昂贵的,现在一个好的开发人员的一个月工资差不多就可以买一个很不错的服务器了,它的负载已经很大了,所以这里面就是说机器性能的浪费可能还不是最关键的,因为机器越来越便宜,你两年以后买的机器要能现在一堆机器都比不过它,所以这方面浪费还不是最关键的。

崔晓琪:我们每一个应用我们都会做均衡。再有就是我们每一个服务设备都会有监控,就是说如果说它一但出现问题话我们都会及时的知道,比如说某个服务出问题了那么我们就会及时知道去解决它或者说服务所在的服务器CPU、内存有问题了这些我们都是及时的知道。

PConline:那我觉得你们在灾备冗余的时候可能也有经验的,比如说你们一般日常你可能要预留一部分资源,象这样的预留资源有多大的比例。

崔晓琪:比如说象数据库,我们现在基本上是CPU保证在50%以下这样安全水平,再往上负载,对于数据库来讲它再往上负载的话可能就会有问题,但是我们现在在做的是如果他一旦超过50或者超过60这样的一个变点我们就会有报警出来,现在CPU可能有问题了,然后需要DBA去看是因为什么引起的,或是因为上了某个程序引起CPU这么高值的变化。

PConline:如果一旦发生系统崩溃,对互联网企业那是灾难性的。之前看过很多这样的案例,一个是沃尔玛,因为沃尔玛的IT系统是全世界应该最牛的企业之一,但是在圣诞节的时候,它的网店最终还是被挤跨了,因为他们做压力测试的时候做了日常的三倍。结果圣诞节前夕网店的购买压力是平时的8倍,还有一个案例包括我们奥运会的售票网站,第一天就跨了,所以在这个高速运载的时候尤其象Vancl这种零售业企业最终负载是很难预料的,也许因为一个太受欢迎的促销它就会死掉了。

崔晓琪:这个是互联网的一个问题。只能看系统方面的预先判断,总不能说你的资源足够大,压力涨一百倍你也不怕,那是一个资源的浪费。这就需要有一个恰当的预估,但是如果出现沃尔玛这种现象也很难预料,因为本身就是把你的判断给打破了,你可能预料到我上这个促销可能是来3倍5倍,但真正他来8倍10倍的话那客户你是控制不了的,所以这种问题,其实我们在上一些促销的时候也会考虑这个问题,就是你上这个促销会不会力度大到我们的服务器支撑不了。>>

面对安全威胁的技术反应

PConline:因为门店的门口大小本来就是天然的限流措施,但是互联网企业没有,那其实我倒不是说想问这个极端情况,我就是想问你们有没有后备资源,这个后备资源怎么确定的,就是说我发觉我的业务量突然的在涨,这个时候是可以做出什么样的反应,那个报警邮件来了,短信来了咱们怎么办。

崔晓琪:其实我们的服务器就刚才我说的我们IT的架构是要支持3倍到5倍的增长,首先这个服务器的资源不能说可钉可铆说我今年可能做3个亿的销售,我就一直销售,它就一定支持服务已经到了60%。这些都是我们刚才所说的安全范围。比如我们的数据库预留50%,这些都是我们相对保守安全的一个指标。其实你说核心数据库他上到60%70%也没有问题,我们现在的数据库基本上是在30%上线,所以我们服务器的资源在线上部分已经有这样的预留资源。

当然如果我们看到最近的销售持续不断的在往上涨,比如说我不是因为一个事件把这个服务器的压力推到这么大,可能是我们确实看到一个曲线平滑的曲线不断的上涨,那这个时候告诉我们可能我们就要买新的服务器了。这个不会是一下子爆发性的,它肯定会有一个缓慢的曲线通道来做这个事情,这就给我们时间联系服务器的供应商。

PConline:谈到DDos攻击这个其实也是一个没有办法根本解决的问题。

崔晓琪:这个只能说是在网络架构上做到尽可能的安全,但是如果有人故意做这种攻击,主要是看IDC的资源能不能扛得住,因为它主要是靠带宽来对抗。

PConline:之前有一个新闻就是说陈总对技术部门有一个1000万的投资投入,这块主要是人力还是设备上的。这种业务的增长出于是哪种考虑呢

崔晓琪:人力和设备上都会有的。陈总对技术非常非常重视,把技术、产品、推广这些部门陈总其实都是很重视的,尤其是技术。因为技术是互联网电子商务的一个基础。这个楼盖多高总要看地基挖多深,所以说在我们比如说融资到多少钱以后,我们的业务的增长有很快的一个增长的话,我们技术部的投资也是增长的非常快,比如说我们这种设备的投资还有人力的投资相比其它比较大的互联网企业都是不差的。所以技术这一块在VANCL公司来讲是很重要的,以后我们还会投入更大的财力物力去发展技术这一块。[返回频道首页]

加载中...