2016年09月22日
一、编程规约
命名规约:
【强制】类名使用UpperCamelCase。 不能以下划线或美元符号打头,必须遵从驼峰形式,但以下情形例外:(领域模型的相关命名)DO / DTO / VO / DAO等。
正例:MarcoPolo / UserDO / HtmlDTO / XmlService / TcpUdpDeal / TaPromotion
反例:macroPolo / UserDo / HTMLDto / XMLService / TCPUDPDeal / TAPromotion【强制】方法名、参数名、成员变量、局部变量都统一使用lowerCamelCase。尽量是英文语法表达,避免使用汉语拼音来命名,严禁使用拼音与英文混合的命名方式。
说明:正确的英文单词拼写和语法可以让代码阅读者易于理解,避免歧义。
正例: localValue / getHttpMessage() / inputUserId
反例: LocalValue / getPingfenByName() [评分的拼音]【强制】常量命名应该全部大写,单词间用下划线隔开,力求语义表达完整清楚,不要嫌名字长。
正例: MAX_STOCK_COUNT
反例: MAX_COUNT【参考】枚举类名建议带上Enum后缀,枚举成员名称需要全大写,单词间用下划线隔开。
说明:枚举其实就是特殊的常量类,且构造方法被默认强制是私有。
正例:枚举名字:DealStatusEnum;成员名称:SUCCESS / UNKOWN_REASON【强制】POJO类中的任何布尔类型的变量,都不要加is,否则部分框架解析会引起序列化错误。
反例:定义为基本数据类型boolean isSuccess;的属性,它的方法也是isSuccess(),HSF框架在反向解析的时候,“以为”对应的属性名称是success,导致属性获取不到,进而抛出异常。【强制】包名统一使用小写,点分隔符之间有且仅有一个自然语义的英语单词。包名统一使用单数形式,但是类名如果有复数含义,类名可以使用复数形式。
正例: 应用工具类包名为com.alibaba.mpp.util、类名为MessageUtils(此规则参考spring的框架结构)【强制】尽量少用缩写,特别是完全不规范的缩写。集团认可的缩写请参考附2。
反例:<某业务代码>AbstractClass“缩写”命名成AbsClass;condition“缩写”命名成 condi,此类随意缩写严重降低了代码的可阅读性。【推荐】如果使用到了设计模式,建议在类名中体现出具体模式。
说明:将设计模式体现在名字中,有利于阅读者快速理解架构设计思想。
正例:public class OrderFactory;
????public class LoginProxy;
????public class ResourceObserver;【推荐】接口类中的方法和属性不要加任何修饰符号(public 也不要加),保持代码的简洁性,并加上有效的javadoc注释。尽量不要在接口里定义变量,如果一定要定义变量,肯定是与接口方法相关,并且是整个应用的基础常量。
正例:接口方法签名:void f();
??? 接口基础常量表示:String COMPANY = "alibaba";
反例:接口方法定义:public abstract void f();
说明:JDK8中接口允许有默认实现,那么这个default方法,是对所有实现类都有价值的默认实现。接口和实现类的命名有三套规则:
?1)【强制】对于Service和DAO类,基于SOA的理念,暴露出来的服务一定是接口,内部的实现类用Impl的后缀与接口区别。
正例: CacheServiceImpl实现CacheService接口。
?2)【推荐】如果是形容能力的接口名称,取对应的形容词做接口名(通常是–able的形式)。
正例:AbstractTranslator实现 Translatable。
?3)【推荐】其它名词类型接口前加I来区别,实现类则去掉“I”即可。
正例: language 实现ILanguage接口。【参考】各层命名规约:
A) Service/DAO层方法命名规约
1) 获取单个对象的方法用get做前缀。
2) 获取多个对象的方法用list做前缀。
3) 获取统计值的方法用count做前缀。
4) 插入的方法总是用save(推荐)或insert做前缀。
5) 删除的方法总是用remove(推荐)或delete做前缀。
6) 修改的方法总是用update做前缀。
B) 领域模型命名规约
1) 数据对象:xxxDO,xxx即为数据表名。
2) 数据传输对象:xxxDTO,xxx为业务领域相关的名称。
3) 展示对象:xxxVO,xxx一般为网页名称。
4) POJO是DO/DTO/BO/VO的统称,禁止命名成xxxPOJO。
常量定义:
【强制】不允许出现任何魔法值(即未经定义的常量)直接出现在代码中。
反例: String key="Id#taobao_"+tradeId;
?????cache.put(key, value);【强制】long或者Long初始赋值时,必须使用大写的L,不能是小写的l,小写容易跟数字1混淆,造成误解。
说明:Long a = 2l; 写的是数字的21,还是Long型的2?【推荐】不要使用一个常量类维护所有常量,应该按常量功能进行归类,分开维护。如:缓存相关的常量放在类:CacheConsts下;系统配置相关的常量放在类:ConfigConsts类下。
说明:大而全的常量类,非得ctrl+f才定位到修改的常量,不利于理解,也不利于维护。【推荐】常量的复用层次有五层:跨应用共享常量、应用内共享常量、子工程内共享常量、包内共享常量、类内共享常量。
?1) 跨应用共享常量:放置在二方库中,通常是client.jar中的const目录下。
?2) 应用内共享常量:放置在一方库的modules中的const目录下。
????反例:易懂变量也要统一定义成应用内共享常量,两位攻城师在两个类中分别定义了表示“是”的变量:
????类A中:public static final String YES = "yes";
????类B中:public static final String YES = "y";
????A.YES.equals(B.YES),预期是true,但实际返回为false,导致产生线上问题。
?3) 子工程内部共享常量:即在当前子工程的const目录下。
?4) 包内共享常量:即在当前包下单独建const目录下。
?5) 类内共享常量:直接在类内部private static final定义。【推荐】如果变量值仅在一个范围内变化用Enum类。如果还带有名称之外的延伸属性,必须使用Enum类,下面正例中的数字就是延伸信息,表示星期几。
正例:public Enum{ MONDAY(1), TUESDAY(2), WEDNESDAY(3), THURSDAY(4), FRIDAY(5), SATURDAY(6), SUNDAY(7);}
OOP规约:
【强制】避免通过一个类的对象引用访问此类的静态变量或静态方法,无谓增加编译器解析成本,直接用类名来访问即可。
【强制】所有的覆写方法,必须加@Override注解。
反例:getObject()与get0bject()的问题。一个是字母的O,一个是数字的0,加@Override可以准确判断是否覆盖成功。另外,如果在抽象类中对方法签名进行修改,其实现类会马上编译报错。【强制】相同参数类型,相同业务含义,才可以使用Java的可变参数,避免使用Object。
说明:比如打印方法: void print(String... str); 不要写成:void print(Object... str);【强制】对外暴露的接口签名,原则上不允许修改方法签名,避免对接口调用方产生影响。接口过时必须加@deprecated注释,并清晰地说明采用的新接口或者新服务是什么。
【强制】不能使用过时的类或方法。
说明:java.net.URLDecoder 中的方法decode(String encodeStr) 这个方法已经过时,应该使用双参数decode(String source, String encode)。接口提供方既然明确是过时接口,那么有义务同时提供新的接口;作为调用方来说,有义务去考证过时方法的新实现是什么。【强制】Object的equals方法容易抛空指针异常,应使用常量或确定有值的对象来调用equals。
正例: "test".equals(object);
反例: object.equals("test");
说明:推荐使用java.util.Objects#equals (JDK1.7引入的工具类)【强制】所有的包装类对象值的比较,全部使用equals方法比较。
说明:对于Integer var=?在-128至127之间的赋值,Integer对象是在IntegerCache.cache产生,会复用已有对象,这个区间内的Integer值可以直接使用==进行判断,但是这个区间之外的所有数据,都会在堆上产生,并不会复用已有对象,这是一个大坑,推荐作用equals方法进行判断。【强制】除局部变量使用基本数据类型外,其它场景都使用包装数据类型,如:方法返回值、形参、POJO类属性。
?说明:
?1)数据库的查询结果可能是null,因为自动拆箱,用基本数据类型接收有NPE风险。
?2)包装数据类型的null值,能够表示赋值不成功,如:远程调用失败,异常退出。
?反例:交易总额涨跌HSF服务,返回值为基本数据类型,调用不成功时,返回的是默认值,页面显示:0%,这是不合理的。
?3)属性没有初值是提醒使用者在需要使用时,必须自己显式地进行赋值,任何NPE问题,或者入库检查,都由使用者来保证。
?反例:基本数据类型做为形参,传入是Integer,会有自动拆箱操作,容易NPE。【强制】定义DO/DTO/VO等POJO类时,不要加任何属性默认值。
反例:某业务的DO的gmtCreate默认值为new Date();但是这个属性在数据提取时并没有置入具体值,在更新其它字段时又附带更新了此字段,导致创建时间被修改成当前时间。【强制】序列化类修改时,请不要修改serialVersionUID字段,避免反序列失败;如果完全不兼容升级,避免反序列化混乱,那么请修改serialVersionUID值。
说明:注意serialVersionUID不一致会抛出序列化运行时异常。【强制】构造方法里面禁止加入任何业务逻辑,如果有初始化逻辑,请放在init方法中。
【推荐】当一个类有多个构造方法,或者多个同名方法,这些方法应该按顺序放置在一起,便于阅读。
【强制】POJO类必须写toString方法。使用工具类source> generate toString时,如果继承了另一个POJO类,注意在前面加一下super.toString。
说明:在方法执行抛出异常时,可以直接调用POJO的toString()方法打印其属性值,便于排查问题。【推荐】类内方法定义顺序依次是:公有方法或保护方法 > 私有方法 > getter/setter方法。
说明:公有方法是类的调用者和维护者最关心的方法,首屏展示最好;保护方法虽然只是子类关心,也可能是“模板设计模式”下的核心方法;而私有方法外部一般不需要特别关心,是一个黑盒实现;因为方法信息价值较低,所有Service和DAO的getter/setter方法放在类体最后。【推荐】本类调用加this,父类调用加super,不管是变量还是方法。这样有利于阅读者清晰知道这个方法是本类定义,还是从父类继承。
-
【推荐】setter方法中,参数名称与类成员变量名称一致,this.成员名=参数名。在get/set方法中,尽量不要增加业务逻辑,增加排查问题难度。
反例:public Integer getData(){ if(true) { return data + 100; } else { return data - 100; } }
-
【推荐】字符串的联接方式,推荐使用StringBuffer和StringBuilder的方法进行扩展:
正例:StringBuffer s = new StringBuffer(); s.append("guan").append("bao");
??如果确定没有线程安全问题,或者是方法内局部变量,推荐使用StringBuilder,在能够提前预估目标字符串的长度时,可以指定StringBuilder初始容量值,避免自动扩容带来的数据拷贝开销与频繁内存分配产生的内存碎片。
【推荐】final可提高程序响应效率,声明成final的情况:
?1) 不需要重新赋值的变量,包括类属性、局部变量。
?2) 对象参数前加final,表示不允许修改引用的指向。
?3) 类方法确定不会被重写。
说明:final修饰的方法会被编译器优化,优化意味着编译器可能将该方法用内联方式载入。final修饰变量表示此变量是不可变的,在多线程读写场景中是线程安全的。【推荐】慎用Object的clone方法来拷贝对象。
说明:对象的clone方法默认是浅拷贝,若想实现深拷贝需要重写clone方法实现属性对象的拷贝。【推荐】类成员与方法访问控制从严:
?1) 如果不允许外部直接通过new来生成对象,那么构造方法必须private。
?2) 工具类不允许有public或default构造方法。
?3) 类的非static成员变量,必须private。
?4) 类的static成员变量如果只是类内部使用,也必须是private。
?5) 若是static成员变量,必须考虑是否为final。
?6) 类成员方法只供类内部调用,必须private。
?7) 如果成员方法只对继承类公开,那么限制为protected。
说明:任何类、方法、参数、变量,严控访问范围。过宽泛的访问范围,不利于模块解耦。思考:如果是一个private的方法,想删除就删除,可是一个public的Service方法,或者一个public的成员变量,删除一下,不得手心冒点汗吗?变量像自己的小孩,尽量在自己的视线内,变量作用域太大,如果无限制的到处跑,那么你会担心的。【推荐】方法的多个参数顺序为:输入参数在前,输出参数在后;代码里先出现的参数在前,后出现的参数在后。
反例1:public Object f(Object obj) {… ; return obj;} //obj既是输入参数,又是返回对象,尽量避免。
反例2:public String f(Long id, String str){ return str + id;} //str和id的使用先后尽量与参数顺序保持一致。
集合处理:
【强制】Map/Set的key为自定义对象时,必须重写hashCode和equals。
说明:为什么要重写hashCode() 。
正例:String重写了hashCode和equals方法,所以我们可以非常愉快地使用String对象作为key来使用。【强制】ArrayList的subList结果不可强转成ArrayList,否则会抛出ClassCastException异常:java.util.RandomAccessSubList cannot be cast to java.util.ArrayList ;
说明: subList 返回的是 ArrayList 的内部类 SubList,并不是 ArrayList ,而是 ArrayList 的一个视图,对于SubList子列表的所有操作最终会反映到原列表上。【强制】在subList场景中,高度注意对原列表的修改,会导致子列表的遍历、增加、删除均产生ConcurrentModificationException 异常。
说明: 抽查表明,九成的开发同学对此知识点都有错误的认知。【强制】使用集合转数组的方法,必须使用集合的toArray(T[] a),传入的是类型完全一样的数组,大小就是list.size()。
说明:直接使用toArray无参方法存在问题,此方法返回值只能是Object[]类,若强转其它类型数组将出现ClassCastException错误。使用toArray带参方法,入参分配的数组空间不够大时,toArray方法内部将重新分配内存空间,并返回新数组地址;如果数组元素大于实际所需,多余的数组元素将被置为null,因此最好将方法入参数组大小定义与集合元素个数一致。【强制】使用工具类Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方法,它的add/remove/clear方法会抛出UnsupportedOperationException异常。
说明:asList的返回对象是一个Arrays内部类,并没有实现集合的修改方法。Arrays.asList体现的是适配器模式,只是转换接口,后台的数据仍是数组。
String[] str = new String[] { "a", "b" };
List list = Arrays.asList(str);
第一种情况:list.add("c"); 运行时异常。
第二种情况:str[0]= "gujin"; 那么list.get(0)也会随之修改。【强制】泛型通配符<? extends T>来接收返回的数据,此写法的泛型集合不能使用add方法。
说明:苹果装箱后返回一个<? extends Fruits>对象,此对象就不能往里加任何水果,包括苹果。-
【强制】不要在foreach循环里进行元素的remove/add操作。remove元素请使用Iterator方式,如果并发操作,需要对Iterator对象加锁。
反例:List<String> a = new ArrayList<String>(); a.add("1"); a.add("2"); for (String temp : a) { if("1".equals(temp)){ a.remove(temp); } }
说明:这个例子的执行结果会出乎大家的意料,那么试一下把“1”换成“2”,会是同样的结果吗?
参考:ConcurrentModificationException异常分析
正例:Iterator<String> it = a.iterator(); while(it.hasNext()){ String temp = it.next(); if(删除元素的条件){ it.remove(); } }
【推荐】集合初始化时,尽量指定集合初始值大小。
说明: ArrayList尽量使用ArrayList(int initialCapacity) 初始化。【推荐】使用entrySet遍历Map类集合KV,而不是keySet方式进行遍历。
说明:keySet其实是遍历了2次,一次是转为Iterator对象,另一次是从hashMap中取出key所对应的value。而entrySet只是遍历了一次就把key和value都放到了entry中,效率更高。如果是JDK8,使用Map.foreach方法。
正例:values()返回的是V值集合,是一个list集合对象;keySet()返回的是K值集合,是一个Set集合对象;entrySet()返回的是K-V值组合集合。-
【推荐】高度注意Map类集合K/V能不能存储null值的情况,如下表格:
集合类 Key Value Super 说明 Hashtable 不允许为null 不允许为null Dictionary 线程安全 ConcurrentHashMap 不允许为null 不允许为null AbstractMap 线程局部安全 TreeMap 不允许为null 允许为null AbstractMap 线程不安全 HashMap 允许为null 允许为null AbstractMap 线程不安全 反例:前期抽样表明近八成的同学认为ConcurrentHashMap是可以置入null值。在“美杜莎”的批量翻译场景中,子线程分发时,出现置入null值的情况,但主线程没有捕获到此异常,导致排查困难。
【参考】合理利用好集合的有序性(sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响。
说明:稳定性指集合每次遍历的元素次序是一定的。有序性是指遍历的结果是按某种比较规则依次排列的。如:ArrayList是order/unsort;HashMap是unorder/unsort;TreeSet是order/sort。【参考】利用Set元素唯一的特性,可以快速对另一个集合进行去重操作,避免使用List的contains方法进行遍历去重操作。
并发处理:
【强制】静态Utils或单例必须是线程安全的。
【强制】线程资源必须通过线程池提供,不允许在应用中自行显式创建线程。
说明:使用线程池的好处是减少在创建和销毁线程上所花的时间以及系统资源的开销,解决资源不足的问题。如果不使用线程池,有可能造成系统创建大量同类线程而导致消耗完内存或者“过度切换”的问题。-
【强制】SimpleDateFormat 是线程不安全的类,一般不要定义为static变量,如果定义为static,必须加锁,或者使用DateUtils工具类。
正例:注意线程安全,使用DateUtils。亦推荐如下处理:private static final ThreadLocal<DateFormat> df = new ThreadLocal<DateFormat>() { @Override protected DateFormat initialValue() { return new SimpleDateFormat("yyyy-MM-dd"); } };
【强制】高并发时,同步调用应该去考量锁的性能损耗。能锁区块,就不要锁整个方法体;能用对象锁,就不要用类锁。
【强制】对多个资源、数据库表、对象同时加锁时,需要保持一致的加锁顺序,否则可能会造成死锁。
说明:线程一需要对表A、B、C依次全部加锁后才可以进行更新操作,那么线程二的加锁顺序也必须是A、B、C,否则可能出现死锁。【参考】注意HashMap的扩容死链,导致CPU飙升的问题。
反例:“采购直达”业务 P2故障,原因是依赖的开源软件中对HashMap有并发写,导致get时死循环,耗尽了CPU资源,参考开源框架误用HashMap导致的线上问题分析【强制】并发修改同一记录时,避免更新丢失,要么在应用层加锁,要么在缓存加锁,要么在数据库层使用乐观锁,使用version作为更新依据。
说明:如果每次访问冲突概率小于20%,推荐使用乐观锁,否则使用悲观锁。乐观锁的重试次数不得小于3次。
正例:集团很多业务使用TairManager方法:incr(namespace, lockKey, 1, 0, expireTime); 判断返回步长是否为1,实现分布式锁。【强制】多线程并行处理定时任务时,Timer运行多个TimeTask时,只要其中之一没有捕获抛出的异常,其它任务便会自动终止运行,使用ScheduledExecutorService则没有这个问题。
反例:阿里云平台产品技术部,域名更新具体产品信息保存到tair,Timer产生了RunTimeExcetion异常后,定时任务不再执行,通过检查日志发现原因,改为ScheduledExecutorService方式。【推荐】使用CountDownLatch进行同步转异步操作,每个线程退出前必须调用countDown方法,线程执行代码注意catch异常,确保countDown方法可以执行,避免主线程无法执行至countDown方法,直到超时才返回结果。
说明:注意,子线程抛出异常堆栈,不能在主线程try-catch到。
反例:在“马可波罗平台”的翻译同步转异步多线程时,由于翻译过程抛出异常,导致countDown方法失败,经常超时才返回。-
【推荐】创建线程或线程池时请指定有意义的线程名称,方便出错时回溯。
正例:public class TimerTaskThread extends Thread { public TimerTaskThread(){ super.setName("TimerTaskThread"); … }
【参考】Executors.newFixedThreadPool(int x) 注意它的队列是无限大的[Integer.MAX_VALUE],如果消费线程的速度小于加入线程对象的速度,那么就有可能产生OOM,推荐使用显示指定队列长度来生成多线程,并且捕获队列满时,线程对象加入的异常。
【参考】volatile解决多线程内存不可见问题。对于一写多读,是可以解决变量同步问题,但是如果多写,同样无法解决线程安全问题。如果想取回count++数据,使用如下类实现:AtomicInteger count = new AtomicInteger(); count.addAndGet(1); 参考内存模型:深入理解java内存模型
说明:count++操作如果是JDK8,推荐使用LongAdder对象,比AtomicLong性能更好(减少乐观锁的重试次数)。【参考】ThreadLocal无法解决共享对象的更新问题,ThreadLocal对象必须使用static修饰。这个变量是针对一个线程内所有操作共有的,所以设置为静态变量,所有此类实例共享此静态变量 ,也就是说在类第一次被使用时装载,只分配一块存储空间,所有此类的对象(只要是这个线程内定义的)都可以操控这个变量。
控制语句:
【强制】switch语句中,每个case后,都必须要break一次;没有任何匹配项,需要显式声明default标签。
【强制】在if/for/while/switch语句中尽量使用大括号,即使只有一行代码,避免使用下面的形式:if (condition) statements;
-
【推荐】推荐尽量少用else,如下写法:
if(condition){ ... return obj; } // 接着写else的业务逻辑代码;
说明:如果使用要if-else if-else方式表达逻辑,【强制】请勿超过3层。
【推荐】不要在条件语句中执行方法,以提高可读性。
正例:InputStream stream = File.open(fileName, "w");
if (stream != null) {…}
反例: if (File.open(fileName, "w") != null)) {…}【推荐】循环体中的语句要考量性能,以下操作尽量移至循环体外处理,如定义对象、变量、获取数据库连接,进行不必要的try-catch操作(这个try-catch是否可以移至循环体外)。
【推荐】方法中需要进行参数校验的场景:
?1) 调用频次低的方法。
?2) 执行时间开销很大的方法,参数校验时间几乎可以忽略不计,但如果因为参数错误导致中间执行回退,或者错误,那得不偿失。
?3) 需要极高稳定性和可用性的方法。
?4) 对外提供的开放接口,不管是HSF/API/HTTP接口。【推荐】方法中不需要参数校验的场景:
?1) 极有可能被循环调用的方法,不建议对参数进行校验。但在方法说明里必须注明外部参数检查。
?2) 底层的方法调用频度都比较高,一般不校验。毕竟是像纯净水过滤的最后一道,参数错误不太可能到底层才会暴露问题。一般DAO层与Service层都在同一个应用中,部署在同一台服务器中,所以DAO的参数校验,可以省略。
?3) 被声明成private只会被自己代码所调用的方法,如果能够确定调用方法的代码传入参数已经做过检查或者肯定不会有问题,此时可以不校验参数。
注释规约:
【强制】类、类属性、类方法的注释必须使用javadoc规范,使用/**内容*/格式,不得使用//xxx方式。
说明:在IDE编辑窗口中,javadoc方式会提示相关注释,生成javadoc可以正确输出相应注释;在IDE中,工程调用方法时,不进入方法即可悬浮提示方法、参数、返回值的意义,提高阅读效率。【强制】所有的类都必须添加创建者信息。
说明:未来集团会统一IDE开发模板。【强制】比较短的注释可以放在一行中,各行的注释尽量采用相同的缩进。如果注释不放在同一行,那么必须按照块注释的格式来写。
【推荐】与其“半吊子”英文来注释,不如用中文注释把问题说清楚。专有名词、关键字,保持英文原文即可。
反例:“TCP连接超时”解释成“传输控制协议连接超时”,理解反而费脑筋。【参考】对于注释的要求:第一、能够准确反应设计思想和代码逻辑;第二、能够描述业务含义,使别的程序员能够迅速了解到代码背后的信息。完全没有注释的大段代码对于阅读者形同天书,注释是给自己看的,即使隔很长时间,也能清晰理解当时的思路;注释也是给继任者看的,使其能够快速接替自己的工作。
【参考】好的命名、代码结构是自解释的,注释力求精简准确、表达到位。避免出现注释的一个极端:过多过滥的注释,代码的逻辑一旦修改,修改注释是相当大的负担。
正例:// put elephant into fridge
??put(elephant, fridge);
??方法名put,加上两个有意义的变量名elephant和fridge,已经说明了这是在干什么,语义清晰的代码不需要额外的注释。【参考】特殊注释标记,请注明标记人与标记时间。注意及时处理这些标记,通过标记扫描,经常清理此类标记。线上故障有时候就是来源于这些标记处的代码。
?1) 待办事宜(TODO):( [标记人,标记时间,[预计处理时间])
???表示需要实现,但目前还未实现的功能。这实际上是一个javadoc的标签,目前的javadoc还没有实现,但已经被广泛使用。只能应用于类,接口和方法(因为它是一个javadoc标签)。
?2) 错误,不能工作(FIXME):([标记人,标记时间,[预计处理时间])
???在注释中用FIXME标记某代码是错误的,而且不能工作,需要及时纠正的情况。
其它:
【强制】在使用正则表达式时,利用好其预编译功能,可以有效加快正则匹配速度。
说明:不要在方法体内定义:Pattern pattern = Pattern.compile(规则);【强制】避免用Apache Beanutils进行属性的copy。
说明:Apache BeanUtils性能较差,可以使用其他方案比如Spring BeanUtils, Cglib BeanCopier。【强制】velocity调用POJO类的属性时,建议直接使用属性名取值即可,模板引擎会自动按规范调用POJO的getXxx(),如果是boolean基本数据类型变量(注意,boolean命名不需要加is前缀),会自动调用isXxx()方法。
说明:注意如果是Boolean包装类对象,优先调用getXxx()的方法。【强制】尽量不要在vm中加入变量声明、逻辑运算符,更不要在vm模板中加入任何复杂的逻辑。
【强制】后台输送给页面的变量必须加$!{var}——中间的感叹号。
说明:如果var=null或者不存在,那么${var}会直接显示在页面上。【强制】注意 Math.random() 这个方法返回是double类型,注意取值范围 0≤x<1(能够取到零值,注意除零异常),如果想获取整数类型的随机数,不要将x放大10的若干倍然后取整,直接使用Random对象的nextInt或者nextLong方法。
【强制】获取当前毫秒数:System.currentTimeMillis(); 而不是new Date().getTime();
说明:如果想获取更加精确的纳秒级时间值,用System.nanoTime。在JDK1.8中,针对统计时间等场景,推荐使用Instant类【推荐】对于“明确停止使用的代码和配置”,如方法、变量、类、配置文件、动态配置属性等要坚决从程序中清理出去,避免造成过多垃圾。清理这类垃圾代码是技术气场,不要有这样的观念:“不做不错,多做多错”。
二、异常日志
异常处理:
【强制】不要捕获Java类库中定义的继承自RuntimeException的运行时异常类,如:IndexOutOfBoundsException / NullPointerException,这类异常由程序员预检查来规避,保证程序健壮性。
正例:if(obj != null) {...}
反例:try { obj.method() } catch(NullPointerException e){…}【强制】异常不要用来做流程控制,条件控制,因为异常的处理效率比条件分支低。
【强制】一大段代码进行try-catch,这是不负责任的表现。catch时请分清稳定代码和非稳定代码,稳定代码指的是无论如何不会出错的代码。对于非稳定代码的catch尽可能进行区分异常类型,再做对应的异常处理。
【强制】捕获异常是为了处理它,不要捕获了却什么都不处理而抛弃之,如果不想处理它,请将该异常抛给它的调用者。最外层的业务使用者,必须处理异常,将其转化为用户可以理解的内容。
【强制】有try块放到了事务代码中,catch异常后,如果需要回滚事务,一定要注意手动回滚事务。
【强制】finally块必须对资源对象、流对象进行关闭,有异常也要做try-catch。
说明:如果JDK7,可以使用try-with-resources方法。【强制】不能在finally块中使用return,finally块中的return返回后方法结束执行,不会再执行try块中的return语句。
【强制】捕获异常与抛异常,必须是完全匹配。捕获异常必须是抛异常的父类。
说明:如果预期抛的是绣球,实际接到的是铅球,就会产生意外情况。【推荐】方法的返回值可以为null,不强制返回空集合,或者空对象等,必须添加注释充分说明什么情况下会返回null值。调用方需要进行null判断防止NPE问题。
说明:本规约明确防止NPE是调用者的责任。即使被调用方法返回空集合或者空对象,对调用者来说,也并非高枕无忧,必须考虑到远程调用失败,运行时异常等场景返回null的情况。【推荐】防止NPE,是程序员的基本修养,注意NPE产生的场景:
?1) 返回类型为包装数据类型,有可能是null,返回int值时注意判空。
??反例:public int f(){ return Integer对象},如果为null,自动解箱抛NPE。
?2) 数据库的查询结果可能为null。
?3) 集合里的元素即使isNotEmpty,取出的数据元素也可能为null。
?4) 远程调用返回对象,一律要求进行NPE判断。
?5) 对于Session中获取的数据,建议NPE检查,避免空指针。
?6) 级联调用obj.getA().getB().getC();一连串调用,易产生NPE。
??反例:“一拍档客户”的返回值从空对象变成了null,导致线上故障,NPE无小事。【推荐】在代码中使用“抛异常”还是“返回错误码”,对于公司外的http/api开放接口必须使用“错误码”;而应用内部推荐异常抛出;跨应用间HSF调用优先考虑使用Result方式,封装isSuccess、“错误码”、“错误简短信息”。
说明:关于HSF方法返回方式使用Result方式的理由:
?1)中间件平台基本上使用ResultDO来封装,由于中间件的普及,本身就有标准的引导含义。
?2)使用抛异常返回方式,调用方如果没有捕获到就会产生运行时错误。
?3)如果不加栈信息,只是new自定义异常,加入自己的理解的error message,对于调用端解决问题的帮助不会太多。如果加了栈信息,在频繁调用出错的情况下,数据序列化和传输的性能损耗也是问题。【推荐】定义时区分unckecked / checked 异常,避免直接使用RuntimeException抛出,更不允许抛出Exception或者Throwable,应使用有业务含义的自定义异常。推荐业界或者集团已定义过的自定义异常,如:DaoException / ServiceException等。
日志规约:
-
【强制】应用中不可直接使用日志系统(Log4j、Logback)中的API,而应依赖使用日志框架(SLF4J、JCL--Jakarta Commons Logging)中的API。什么是日志框架和日志系统,请参考webx作者宝宝的文章,文章里也详细说明了为什么不能直接依赖使用日志系统而是日志框架,以及应用的pom中如何做dependencyManagement。
说明:日志框架(SLF4J、JCL--Jakarta Commons Logging)的使用方式(推荐使用SLF4J):
使用SLF4J:import org.slf4j.Logger; import org.slf4j.LoggerFactory; private static final Logger logger = LoggerFactory.getLogger(Abc.class);
使用JCL:
import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; private static final Log log = LogFactory.getLog(Abc.class);
参考链接:为什么使用slf4j
【强制】日志文件推荐至少保存15天,因为有些异常具备以“周”为频次发生的特点。对于当天日志,以“应用名.log”来保存,保存在/home/admin/应用名/logs/目录下,过往日志格式为: {logname}.log.{保存日期},日期格式:yyyy-MM-dd
说明:以mppserver应用为例,日志保存在/home/admin/mppserver/logs/mppserver.log,历史日志名称为mppserver.log.2016-08-01【强制】应用中的扩展日志(如打点、临时监控、访问日志等)命名方式:appName_logType_logName.log。logType:日志类型,推荐分类有stats/desc/monitor/visit等;logName:日志描述。这种命名的好处:通过文件名就可知道日志文件属于什么应用,什么类型,什么目的,也有利于归类查找。
正例:mppserver应用中单独监控时区转换异常,如:mppserver_monitor_timeZoneConvert.log
说明:推荐对日志进行分类,错误日志和普通提示日志尽量分开存放,便于开发人员查看,也便于通过日志对系统进行及时监控。-
【强制】对trace/debug/info级别的日志输出,必须使用条件输出形式或者使用占位符的方式,否则大量的对象toString和字符串拼接会带来严重的性能问题。
正例:(条件)if (logger.isDebugEnabled()) { logger.debug("Processing trade with id: " + id + " symbol: " + symbol); }
正例:(占位符)
logger.debug("Processing trade with id: {} and symbol : {} ", id, symbol);
-
【强制】避免重复打印日志,浪费磁盘空间,务必在log4j.xml中设置additivity=false。
正例:<logger name="com.taobao.ecrm.member.config" additivity="false"\>
【强制】生产环境禁止直接使用System.out 或System.err 输出日志或使用e.printStackTrace()打印异常堆栈。由于标准日志输出与标准错误输出文件每次Jboss重启时才滚动,如果大量输出送往这两个文件,容易造成文件大小超过操作系统大小限制。
【强制】异常信息应该包括两类信息:案发现场信息和异常堆栈信息。如果不处理,那么往上抛。
正例:logger.error(各类参数或者对象toString + "_" + e.getMessage(), e);
输出的POJO类必须重写toString方法,否则只输出此对象的hashCode值(地址值),没啥参考意义。【推荐】可以使用warn日志级别来记录用户输入参数错误的情况,避免用户投诉时,无所适从。注意日志输出的级别,error级别只记录系统逻辑出错、异常、或者重要的错误信息。如非必要,请不要在此场景打出error级别,避免频繁报警。
【推荐】如果使用log.warn记录跟踪调试信息,一定要注意日志输出量的问题,避免把服务器磁盘撑爆,并记得及时删除这些观察日志。
【参考】如果日志用英文描述不清楚,推荐使用中文注释。对于中文UTF-8的日志,在secureCRT中,set encoding=utf-8;如果中文字符还乱码,请设置:全局>默认的会话设置>外观>字体>选择字符集gb2312;如果还不行,执行命令:set termencoding=gbk,并且直接使用中文来进行检索。
三、数据库规约
建表规约:
【强制】表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsigned tinyint( 1表示是,0表示否),此规则适用于odps建表方式。
说明:任何字段如果为非负数,必须是unsigned。【强制】小数类型为decimal,禁止使用float和double。
说明:float和double在存储的时候,存在精度损失的问题,很可能使用插入的值与数据库中的值进行等于比较的时候,得出不正确的结果。如果存储的数据范围超过decimal的范围,建议将数据拆成整数和小数分开存储。【强制】如果存储的字符串长度几乎相等,使用CHAR定长字符串类型。
【强制】表名、字段名必须使用小写字母或数字,字段命名可参考附2;禁止出现数字开头,禁止两个下划线中间只出现数字。数据库字段名的修改代价很大,因为无法进行预发布,所以字段名称需要慎重考虑。
正例:getter_admin,task_config,level3_name
反例:GetterAdmin,taskConfig,level_3_name【强制】主键索引命名,为pk_表名(一般情况下id为主键索引指定为unsigned bigint、自增、步长为1);唯一索引,则为uk_字段名;普通索引,标记成idx_字段名。
说明:pk_ 即primary key;uk_ 即 unique key;idx_ 即index的简称。【强制】表必备三字段:id, gmt_create, gmt_modified ,其中id必为主键,gmt_modified最好建为索引。
说明:历史数据归档与云梯同步中心很多情形是以gmt_modified进行增量数据拉取。【强制】表名不使用复数名词。
说明:表名应该仅仅表示表里面的实体内容,不应该表示实体数量,对应于DO类名也是单数形式,符合表达习惯。【强制】禁用保留字,如desc、range、match、delayed等,参考官方保留字。
【推荐】字段允许适当冗余,以提高性能,但是必须考虑数据同步的情况。冗余字段应遵循:
?1)不是频繁修改的字段。
?2)不是varchar超长字段,更不能是text字段。
正例:各业务线经常冗余存储商品名称,避免查询时需要调用IC服务获取。【推荐】表的命名最好是加上“业务名称_表的作用”,避免上云梯后,再与其它业务表关联时有混淆。
正例:tiger_task / tiger_reader / mpp_config【推荐】库名与应用名称尽量一致。
索引规约:
【强制】对于varchar字段建立索引,必须指定索引长度,没必要对全字段建立索引,根据实际文本区分度决定索引长度。
说明:索引的长度与区分度是一对矛盾体,一般对字符串类型数据,长度为20的索引,区分度会高达90%以上,可以使用count(distinct left(列名, 索引长度))/count(*)的区分度来确定。【强制】数据库的like尽量限制使用,页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决。
说明:索引文件具有B-Tree的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。【强制】业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引。
说明:不要以为唯一索引影响了insert速度,这个速度损耗可以忽略,但提高查找速度是明显的;另外,即使在应用层做了非常完善的校验和控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。【强制】尽量不要join,尤其是超过三个表的join是禁止的。需要join的字段,数据类型保持绝对一致。多表关联查询时,保证被关联的字段需要有索引。
【强制】在表查询中,一律不要使用 * 作为查询的字段列表,需要哪些字段必须明确写明。
说明:1)增加查询分析器解析成本。 2)增减字段容易与resultMap配置不一致。【推荐】利用覆盖索引来进行查询操作,来避免回表操作。
说明:如果一本书需要知道第11章是什么标题,会翻开第11章对应的那一页吗?目录浏览一下就好,这个目录就是起到覆盖索引的作用。
正例:IDB能够建立索引的种类:主键索引、唯一索引、普通索引,而覆盖索引是一种查询的一种效果,用explain的结果,extra列会出现:using index.【推荐】如果有order by的场景,请注意利用索引的有序性。order by 最后的字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现file_sort的情况,影响查询性能。
正例:where a=? and b=? order by c; 索引:a_b_c
反例:索引中有范围查找,那么索引有序性无法利用,如:WHERE a>10 ORDER BY b; 索引a_b无法排序。【推荐】利用延迟关联或者子查询优化超多分页场景。
说明:MySQL并不是跳过offset行,而是取offset+N行,然后返回放弃前offset行,返回N行,那当offset特别大的时候,效率就非常的低下,要么控制返回的总页数,要么对超过特定阈值的页数进行SQL改写。
正例:先快速定位需要获取的id段,然后再关联:
SELECT a.* FROM 表1 a, (select id from 表1 where 条件 LIMIT 100000,20 ) b where a.id=b.id
反例:“服务市场”某交易分页超过1000页,用户点击最后一页时,数据库基本处于半瘫痪状态。【推荐】SQL性能优化的目标:至少要达到 range 级别,要求是ref级别,如果可以是consts最好。
说明:
?1)consts 单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到数据。
?2)ref 指的是使用普通的索引。(normal index)
?3)range 对索引进范围检索。
反例:explain表的结果,type=index,索引物理文件全扫描,速度非常慢,这个index级别比较range还低,与全表扫描是小巫见大巫。【推荐】建组合索引的时候,区分度最高的在最左边。如果where a=? and b=? ,a列的几乎接近于唯一值,那么只需要单建idx_a索引即可。
【推荐】in操作能避免则避免,若实在避免不了,需要仔细评估in后边的集合元素数量,控制在1000个之内。
【推荐】如果修改字段含义或对字段表示的状态追加时,需要及时更新字段注释。
【参考】合适的字符存储长度,不但节约数据库表空间、节约索引存储,更重要的是提升检索速度。
正例:人的年龄用unsigned tinyint(表示范围0-255,人的寿命不会超过255岁);海龟就必须是smallint,但如果是太阳的年龄,就必须是int;如果是所有恒星的年龄都加起来,那么就必须使用bigint。【参考】创建索引时避免有如下极端误解:
?1)索引宁滥勿缺
误认为一个查询就需要建一个索引。
?2)吝啬索引的创建
误认为索引会消耗空间、严重拖慢更新和新增速度。
?3)抵制唯一索引
误认为唯一索引一律需要在应用层通过“先查后插”方式解决。
MYSQL规约:
【强制】不要使用count(列名)或count(常量)来替代count(*),count(*)就是SQL92定义的标准统计行数的语法,跟数据库无关,跟NULL和非NULL无关。
说明:count(*)会统计NULL值(真实行数),而count(列名)不会统计。【强制】count(distinct col) 计算该列不为NULL的不重复数量。注意 count(col1, col2) 如果其中一列全为NULL,那么即使另一列有不同的值,也返回为0。
【强制】count(col)对“是NULL的col列”返回为0,而sum(col)则为NULL,因此注意sum(col)的NPE问题。可以使用如下方式来避免:SELECT IF(ISNULL(SUM(g)),0,SUM(g)) FROM table;
说明:NULL<>NULL 的返回结果是NULL,不是false。
NULL=NULL的返回结果也是NULL,不是true。
高度注意:NULL值与任何值的比较都为NULL,即NULL<>1,返回的是NULL,而不是true。【强制】在代码中写分页查询逻辑时,若count为0应直接返回,避免执行后面的分页语句。
【强制】varchar是可变长字符串,不预先分配存储空间,长度不要超过5000,如果存储长度大于此值,定义字段类型为TEXT,独立出来一张表,用主键来对应,避免影响其它字段索引效率。
【强制】不得使用级联与外键,一切外键概念必须在应用层解决。
说明:(概念解释)学生表中的student_id是主键,那么成绩表中的student_id则为外键。如果更新学生表中的student_id,同时触发成绩表中的student_id更新,则为级联更新。外键与级联更新适用于单机低并发,不适合分布式、高并发集群;级联更新是强阻塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。【强制】禁止使用存储过程,存储过程难以调试和扩展,更没有移植性。
【强制】IDB数据订正时,删除和修改记录时,要先select,避免出现误删除,确认无误才能提交执行。
【参考】因阿里巴巴全球化需要,所有的字符存储与表示,均以UTF-8编码,那么字符计数方法注意:
说明:
SELECT LENGTH("阿里巴巴"); 返回为12
SELECT CHARACTER_LENGTH("阿里巴巴"); 返回为4【参考】TRUNCATE TABLE 在功能上与不带 WHERE 子句的 DELETE 语句相同:二者均删除表中的全部行。但 TRUNCATE TABLE 比 DELETE 速度快,且使用的系统和事务日志资源少,但TRUNCATE无事务且不触发trigger,有可能造成事故,故不建议在开发代码中使用DDL语句。
ORM规约:
【强制】POJO类的boolean属性不能加is,而数据库字段必须加is_,要求在resultMap中进行字段与属性之间的映射。
说明:参见定义POJO类以及数据库字段定义规定,在sql.xml增加映射,是必须的。【强制】不要用resultClass当返回参数,即使所有类属性名与数据库字段一一对应,也需要定义;反过来,每一个表也必然有一个与之对应。
说明:配置映射关系,使字段与DO类解耦,方便维护。【强制】xml配置中参数注意使用:#{},#param# 不要使用${} 此种方式容易出现sql注入。
-
【强制】iBATIS自带的queryForList(String statementName,int start,int size)不推荐使用。
说明:其实现方式是在数据库取到statementName对应的sql语句的所有记录,再通过subList取start,size的子集合,线上因为这个原因曾经出现过OOM。
正例:在sqlmap.xml中引入 #start#, #size#Map<String, Object> map = new HashMap<String, Object>(); map.put("start", start); map.put("size", size);
【强制】不允许直接拿HashMap与HashTable作为查询结果集的输出。
反例:某同学为避免写一个<resultMap>,直接使用HashTable来接收数据库返回结果,结果出现日常是把bigint转成Long值,而线上由于数据库版本不一样,解析成BigInteger,导致线上问题。【强制】更新数据表记录时,必须同时更新记录对应的gmt_modified字段值为当前时间。
【推荐】不要写一个大而全的数据更新接口,传入为POJO类,不管是不是自己的目标更新字段,都进行update table set c1=value1,c2=value2,c3=value3; 这是不对的。执行sql时,尽量不要更新无改动的字段,一是易出错;二是效率低;三是binlog增加存储。
【参考】@Transactional事务不要滥用。事务会影响数据库的QPS,另外使用事务的地方需要考虑各方面的回滚方案,包括缓存回滚、搜索引擎回滚、消息补偿、统计修正等。
<isEqual>中的compareValue是与属性值对比的常量,一般是数字,表示相等时带上此条件;<isNotEmpty>表示不为空且不为null时执行;<isNotNull>表示不为null值时执行。
四、工程规约
应用分层:
- OpenApi层:可直接封装Service接口暴露成HSF接口,或者通过Web封装成http接口。
- 显示层:模板渲染层。当前主要是velocity渲染,JS渲染,JSP渲染等。
- Web层:主要是对访问控制进行转发,各类基本参数校验,或者不复用的业务简单处理等。
- Service层:相对具体的业务逻辑服务层。
-
Manager层:通用业务处理层,它有如下特征:
???1) 对第三方平台封装的层,预处理返回结果及转化异常信息;
???2) 对Service层通用能力的下沉,如缓存方案、中间件通用处理;
???3) 与DAO层交互,对DAO的业务通用能力的封装。
- DAO层:数据访问层,与底层Mysql、Oracle、Hbase、OB进行数据交互。
- 第三方平台:包括其它部门HSF开放接口,基础平台,其它公司的HTTP接口。
??在Service层往上抛的同时就必须使用日志,因为是RPC调用,可能本地出错,未必能正常反馈到业务端。这里就必须尽可能带上参数信息,相当于保护案发现场,并打印异常堆栈。
??如果Manager层与Service同机部署,日志方式与DAO层处理一致,如果是单独部署,则采用与Service一致的处理方式。
??Web层绝不应该继续往上抛异常,因为已经处于顶层,无继续处理异常的方式,如果意识到这个异常将导致页面无法正常渲染,那么就应该直接跳转到友好错误页面,尽量加上友好的错误提示信息。
??openApi层要将异常处理成错误码和错误信息方式返回。
- DO(Data Object):与数据库表结构一一对应,通过DAO层向上传输数据源对象。
- DTO(Data Transfer Object):数据传输对象,Service和Manager向外传输的对象。
- BO(Business Object):业务对象。可以由Service层输出的封装业务逻辑的对象。
- QUERY:数据查询对象,各层接收上层的查询请求。注:超过2个参数的查询封装,禁止使用Map类来传输。
- VO(View Object):显示层对象,通常是Web向模板渲染引擎层传输的对象。
二方库规约:
【强制】定义GAV遵从以下规则:
?1) GroupID格式:com.{公司/BU }.业务线.[子业务线],最多4级。
??说明:{公司/BU} 例如:alibaba/taobao/tmall/aliexpress等BU一级;子业务线可选。
??正例:com.taobao.tddl com.alibaba.sourcing.multilang
?2) ArtifactID格式:产品线名-模块名。语义不重复不遗漏,尽量先到集团仓库中心去查证一下。
??正例:tc-client / uic-api / tair-tool
?3) Version:详细规定参考下方。【强制】二方库版本号命名方式:主版本号.次版本号.修订号
?1) 主版本号:当做了不兼容的API 修改,或者增加了能改变产品方向的新功能。
?2) 次版本号:当做了向下兼容的功能性新增(新增类、接口等)。
?3) 修订号:修复bug,没有修改方法签名的功能加强,保持 API 兼容性。
反例:仓库内某二方库版本号从1.0.0.0开始,一直默默“升级”成1.0.0.64,完全失去版本的语义信息。
说明:集团任何中间件、中台业务、二方包都必须遵守此版本约定。【强制】二方库定制包的命名方式,在上一条规定的版本号之后加“-英文说明[序号]”,英文说明可以是部门简称、业务名称,序号直接紧跟在英文说明之后,表示此定制包的顺序号。
说明:TDDL给SCM定制的版本号:1.0.0-SCM1。注:请尽可能在应用端来解决类冲突和加载问题,避免随意发布此类定制包。【强制】线上应用尽量不要依赖SNAPSHOT版本(安全包除外);正式发布的类库必须使用RELEASE版本号升级+1的方式,且版本号不允许覆盖升级,必须去*仓库进行查证。
说明:不依赖SNAPSHOT版本是保证应用发布的幂等性。另外,也可以加快编译时的打包构建。【强制】二方库的新增或升级,尽量保持除功能点之外的其它jar包仲裁结果不变。如果有改变,必须明确评估和验证,可使用jar包二进制兼容性检查工具:二方库检查工具指南
说明:建议进行dependency:resolve前后信息比对,如果仲裁结果完全不一致,那么通过dependency:tree命令,找出差异点,进行<excludes>排除jar包;仲裁详细规则参考:细说maven依赖仲裁原则
反例:2014年,因二方库升级导致的P2以上故障数在统计榜上排名第一,大家需要高度重视。【强制】二方库里可以定义枚举类型,参数可以使用枚举类型,但是接口返回值不允许使用枚举类型。
说明:由于升级原因,导致双方的枚举类不尽相同,在接口解析,类序列化时出现异常。【强制】依赖于一个二方库群时,必须定义一个统一版本变量,避免版本号不一致。
说明:依赖
springframework-core,-context,-beans,它们都是同一个版本,可以定义一个变量来保存版本:${spring.version},定义依赖的时候,引用该版本。【强制】禁止在子项目的pom依赖中出现相同的GroupId,相同的ArtifactId,但是不同的Version。
说明:在本地调试时会使用各子项目指定的版本号,但是合并成一个war,只能有一个版本号出现在最后的lib目录中。曾经出现过线下调试是正确的,发布到线上出故障的先例。-
【推荐】工具类二方库已经提供的,尽量不要在本应用中编程实现。
- json操作: fastjson
- md5操作:commons-codec
- 工具集合:Guava包
- 数组操作:ArrayUtils(org.apache.commons.lang3.ArrayUtils)
- 集合操作:CollectionUtils(org.apache.commons.collections4.CollectionUtils)
- 除上面以外还有NumberUtils、DateFormatUtils、DateUtils等优先使用org.apache.commons.lang3这个包下的,不要使用org.apache.commons.lang包下面的。原因是commons.lang这个包是从jdk1.2开始支持的所以很多1.5/1.6的特性是不支持的,例如:泛型。
【推荐】所有pom文件中的依赖声明放在<dependencies>语句块中,所有版本仲裁放在<dependencyManagement>语句块中。
说明:<dependencyManagement>里只是声明依赖,并不实现引入,因此子项目需要显式的声明依赖,version和scope都读取自父pom。而<dependencies>所有声明在主pom的<dependencies >里的依赖都会自动引入,并默认被所有的子项目继承。参考:多模块项目POM编写最佳实践【推荐】二方库尽量不要有配置项,最低限度不要再增加配置项。详细原因参考:二方库禁放配置项
【参考】为避免应用二方库的依赖冲突问题,二方库发布者应当遵循以下原则:
1)精简可控原则。移除一切不必要的API和依赖,只包含 Service API、必要的领域模型对象、Utils类、常量、枚举等。如果依赖其它二方库,尽量是provided引入,让二方库使用者去依赖具体版本号;尽量没有autoconf配置项,避免应用配置项爆炸;无log具体实现,只依赖日志框架。
2)稳定可追溯原则。每个版本的变化应该被记录,二方库由谁维护,源码在哪里,都需要能方便查到。除非用户主动升级版本,否则公共二方库的行为不应该发生变化。
说明:集团的二方库几乎都是航母级依赖,从底层netty,到spring/ibatis/apache,以及集团中间件,都是默认scope(默认是complile,直接打包给使用者),给二方库使用者造成依赖冲突困扰、以及系统不稳定性,呼吁各二方库发布方认真遵守这两个原则。
中间件规约:
【强制】tair使用注意双集群和单集群的差异,不要对双集群进行put值的覆盖,必须先invalid,再进行put操作;如果删除值,也必须进行invalid操作。
说明: 说说mdb双机房独立集群【强制】任何操作,都是先保存数据库成功后,再进行缓存的新增、更新、清除操作。
【强制】新应用直接使用webx3,不再使用citrus-webx-compatible Webx兼容包。 <groupId>com.alibaba.citrus.private</groupId>
<artifactId>citrus-webx-compatible</artifactId>【推荐】webx配置中的.do写法表示异步接口,不需要标新立异写出: .ajax / .asyn / .x
【推荐】HSF配置方式集中,涉及HSF相关的配置推荐放置到同一个配置文件中,这样方便后续的维护。
正例:服务客户端可以放置到一个配置文件中,比如:hsf-consumer.xml,对于提供方,可以放到hsf-provider.xml中。-
【推荐】客户端统一设置接口中所有方法的超时时间(单位ms),超时设置优先级由高到低是:1)客户端MethodSpecial; 2)客户端接口级别;3)服务端MethodSpecial; 4)服务端接口级别。
说明:methodSpecials为可选配置,含义为为方法单独配置超时(单位ms),这样接口中的方法可以采用不同的超时时间,该配置优先级较高,配置如下:<property name="methodSpecials"> <list> <bean class="com.taobao.hsf.model.metadata.MethodSpecial"> <property name="methodName" value="sum" /> <property name="clientTimeout" value="2000" /> </bean> </list> </property>
【推荐】避免在HSF的callback线程池中执行过于耗时的操作,否则会对内存等系统资源产生压力。或者在callback中实现中做阻塞操作,比如调用HSF服务等。
说明:HSF客户端远程调用时,可以使用callback调用来减少对调用线程的阻塞。客户端发起调用后,线程直接返回,远端响应写回后通过callback线程池完成业务处理,-
【推荐】对于序列化方式的选择,推荐默认hessian2即可,但HSF支持多种序列化方式,使用时注意兼容性。
序列化配置方式:<bean class="com.taobao.hsf.app.spring.util.HSFSpringProviderBean" init-method="init"> <!--serializeType为可选配置[String(hessian|java)],含义为序列化类型,默认为hessian--> <property name="serializeType" value="hessian"/> </bean>
-
【推荐】了解每个服务大致的平均耗时,可以通过独立线程池配置,将较慢的服务与主线程池隔离开,不致于各服务线程同归于尽。
说明:HSF服务端在框架的线程池中运行,该线程池默认会处理所有提供的服务接口请求,因此如果有接口的处理时间较慢,将会使HSF线程池消耗殆尽,使得其他接口的请求不能够被处理。<bean class="com.taobao.hsf.app.spring.util.HSFSpringProviderBean" init-method="init"> <!-- 配置该服务单独线程池,并指定最小活跃线程数, 会单独切一个线程池出来,其余线程使用600-N个线程,不确定场景时不建议单独配置 --> <property name="corePoolSize" value="10"/> <!-- 配置该服务单独线程池,并指定最大活跃线程数, 会单独切一个线程池出来,其余线程使用600-N个线程,不确定场景时不建议单独配置 --> <property name="maxPoolSize" value="60"/> </bean>
【推荐】使用HSF提供的优雅上下线来避免流量过早的进入,以及分层发布来做到有策略的服务发布。
说明:HSF服务端在发布时,地址会推送到配置中心ConfigServer做服务注册,客户端就会开始调用服务端。当应用刚启动的时候,Java没有完全编译为本地码,所以性能较低,因此会造成应用启动初期负载较高的情况,在客户端看来应用提供的服务就会出现超时或者服务线程池满的问题。建议升级JDK版本到1.8,在JDK1.8下将会默认开启分层编译,减少Java编译线程对资源的占用。详细内容可以参考:优雅上下线 和分层发布。【推荐】Diamond配置集(configset)和标识(dataId)的长度都不要超过256个字符,特别要注意在代码运行中拼装的字符串长度限制。只允许英文字符和4种特殊字符("."、":"、"-"、"_")。
正例:(dataId的命名可以类似于)com.taobao.diamond.switch或diamond:switch。
服务器规约:
【推荐】调小TCP协议的time_wait等待时间。
说明:基于TCP的HTTP协议由服务端关闭TCP连接,在连接以四次握手结束后,该连接仍会进入time_wait状态等待一段时间后才真正关闭。在高并发访问情形下,会因处于等待关闭的连接数太多而无法建立新的连接,为了缓解或根治这一问题需要在HTTP服务器上调小此等待值。调小此等待值对于优化HTTP服务器的请求处理能力和降低服务器负载效果明显。在Linux服务器上请通过变更/etc/sysctl.conf文件去修改该缺省值。【推荐】调大服务器所支持的最大文件句柄数(File Descriptor,简写为fd)。
说明:主流操作系统的设计是将TCP/UDP连接采用与文件一样的方式去管理,即一个连接对应于一个fd。集团使用主流的Linux服务器默认所支持最大fd数量为1024,当并发连接数很大时很容易因为fd不足而出现“open too many files”错误,导致新的连接无法建立。 建议将Linux服务器所支持的最大句柄数调高数倍(与服务器的内存数量相关)。【推荐】给JVM设置-XX:+HeapDumpOnOutOfMemoryError参数,让JVM碰到OOM场景时输出dump信息
说明:OOM的发生是有概率的,甚至有规律地相隔数月才出现一例,出现时的现场信息对查错非常有价值。【参考】服务器内部重定向必须使用forward;外部重定向地址必须使用URL Broker生成,否则因线上采用HTTPS协议而导致浏览器提示“不安全”。此外,还会带来URL维护不一致的问题。
后记
项目中长期计划:
- 半年例行完善一次本开发规约。
- ATA组织规约考试认证。
- 新人入职测试及培训。
- IDE自动化检测工具开发。
- 与Aone共建推出自动化检测脚本。
附1:本规约专有名词
-
DO(Data Object):集团专指数据库表一一对应的POJO类。
-
GAV(GroupId、ArtifactctId、Version):Maven坐标,是用来唯一标识jar包。
- OOP(Object Oriented Programming): 本文泛指类、对象的编程处理方式。
-
ORM(Object Relation Mapping): 对象关系映射,对象领域模型与底层数据之间的转换,本文泛指iBATIS, mybatis等框架。
-
POJO(Plain Ordinary Java Object):在本规约中,POJO专指只有set/get/toString的简单类,包括DO/DTO/BO/VO等。
- NPE(java.lang.NullPointerException): 空指针异常。
附2:命名推荐列表
名称 | 中文描述 | 示例 | 说明 |
---|---|---|---|
abs | 绝对的 | absolute的简写 | |
avatar | 用户头像 | ||
avg | 平均 | average的简写 | |
area | 区域 | ||
biz | 业务 | biz_type | |
buyer | 买家 | 卖家为seller | |
category | 类目 | 勿简写成cate | |
city | 城市 | ||
code | 码 | ||
comment | 评论 | comment_count | |
copy | 文案 | 文案管理系统(medusa)的文案标准翻译 | |
content | 内容 | ||
count | 数量 | count, xxx_count | |
credit | 信用 | credit_level | |
discount | 折扣 | ||
expired | 过期时间 | expired_date | |
favorite | 收藏 | favorite_count | |
id | 标识 | user_id | 数据库默认主键 |
info | 信息 | info, xxx_info | information的简写 |
lang | 语种 | language的简写 | |
level | 等级,层级 | ||
log | 日志 | ||
lv1 | 一级 | lv是level的简写 | |
lv(n) | n级 | lv是level的简写 | |
key | 关键词、主键等 | key, xxx_key | |
order | 顺序, 订单 | ||
param | 参数 | parameter的简写 | |
price | 价格 | ||
province | 省 | ||
pv | 浏览数 | ||
name | 名字 | name, xxx_name | 各种对象的名称都可以 |
nick | 昵称 | nick, xxx_nick | 别名、昵称、旺旺昵称 |
score | 分数 | ||
seller | 卖家 | 买家为buyer | |
seq | 序号 | sequence的简写 | |
ship | 运输、运费 | ||
shop | 店铺 | ||
sku | 最小库存单元 | ||
source | 来源 | 禁止写成src | |
spu | 标准产品单元 | ||
snapshot | 快照 | ||
status | 状态 | status, xxx_status | 勿用state表达状态 |
stock | 库存 | ||
summary | 摘要,简介 | ||
tag | 标签 | ||
title | 标题 | title, xxx_title | |
type | 类型 | type, xxx_type | |
url | http地址 |
上一篇: 不同体质的瑜珈练习方法