Date和Calendar
在计算机中,应该如何表示日期和时间呢?
我们经常看到的日期和时间表示方式如下:
- 2019-11-20 0:15:00 GMT+00:00
- 2019年11月20日8:15:00
- 11/19/2019 19:15:00 America/New_York
如果直接以字符串的形式存储,那么不同的格式,不同的语言会让表示方式非常繁琐。
在理解日期和时间的表示方式之前,我们先要理解数据的存储和展示。
当我们定义一个整型变量并赋值时:
int n = 123400;
编译器会把上述字符串(程序源码就是一个字符串)编译成字节码。在程序的运行期,变量n
指向的内存实际上是一个4字节区域:
┌──┬──┬──┬──┐
│00│01│e2│08│
└──┴──┴──┴──┘
注意到计算机内存除了二进制的0
/1
外没有其他任何格式。上述十六机制是为了简化表示。
当我们用System.out.println(n)
打印这个整数的时候,实际上println()
这个方法在内部把int
类型转换成String
类型,然后打印出字符串123400
。
类似的,我们也可以以十六进制的形式打印这个整数,或者,如果n
表示一个价格,我们就以$123,400.00
的形式来打印它:
可见,整数123400
是数据的存储格式,它的存储格式非常简单。而我们打印的各种各样的字符串,则是数据的展示格式。展示格式有多种形式,但本质上它就是一个转换方法:
String toDisplay(int n) { ... }
理解了数据的存储和展示,我们回头看看以下几种日期和时间:
- 2019-11-20 0:15:01 GMT+00:00
- 2019年11月20日8:15:01
- 11/19/2019 19:15:01 America/New_York
它们实际上是数据的展示格式,分别按英国时区、中国时区、纽约时区对同一个时刻进行展示。而这个“同一个时刻”在计算机中存储的本质上只是一个整数,我们称它为Epoch Time
。
Epoch Time
是计算从1970年1月1日零点(格林威治时区/GMT+00:00)到现在所经历的秒数,例如:
1574208900
表示从1970年1月1日零点GMT时区到该时刻一共经历了1574208900秒,换算成伦敦、北京和纽约时间分别是:
1574208900 = 北京时间2019-11-20 8:15:00
= 伦敦时间2019-11-20 0:15:00
= 纽约时间2019-11-19 19:15:00
因此,在计算机中,只需要存储一个整数1574208900
表示某一时刻。当需要显示为某一地区的当地时间时,我们就把它格式化为一个字符串:
String displayDateTime(int n, String timezone) { ... }
Epoch Time
又称为时间戳,在不同的编程语言中,会有几种存储方式:
- 以秒为单位的整数:1574208900,缺点是精度只能到秒;
- 以毫秒为单位的整数:1574208900123,最后3位表示毫秒数;
- 以秒为单位的浮点数:1574208900.123,小数点后面表示零点几秒。
它们之间转换非常简单。而在Java程序中,时间戳通常是用long
表示的毫秒数,即:
long t = 1574208900123L;
转换成北京时间就是2019-11-20T8:15:00.123
。要获取当前时间戳,可以使用System.currentTimeMillis()
,这是Java程序获取时间戳最常用的方法。
标准库API
我们再来看一下Java标准库提供的API。Java标准库有两套处理日期和时间的API:
- 一套定义在
java.util
这个包里面,主要包括Date
、Calendar
和TimeZone
这几个类; - 一套新的API是在Java 8引入的,定义在
java.time
这个包里面,主要包括LocalDateTime
、ZonedDateTime
、ZoneId
等。
为什么会有新旧两套API呢?因为历史遗留原因,旧的API存在很多问题,所以引入了新的API。
那么我们能不能跳过旧的API直接用新的API呢?如果涉及到遗留代码就不行,因为很多遗留代码仍然使用旧的API,所以目前仍然需要对旧的API有一定了解,很多时候还需要在新旧两种对象之间进行转换。
本节我们快速讲解旧API的常用类型和方法。
Date
java.util.Date
是用于表示一个日期和时间的对象,注意与java.sql.Date
区分,后者用在数据库中。如果观察Date的源码,可以发现它实际上存储了一个long类型的以毫秒表示的时间戳:
public class Date implements Serializable, Cloneable, Comparable<Date> {
private transient long fastTime;
...
}
我们来看Date的基本用法:
注意getYear()
返回的年份必须加上1900
,getMonth()
返回的月份是0
~11
分别表示1~12月,所以要加1,而getDate()
返回的日期范围是1
~31
,又不能加1。
打印本地时区表示的日期和时间时,不同的计算机可能会有不同的结果。如果我们想要针对用户的偏好精确地控制日期和时间的格式,就可以使用SimpleDateFormat
对一个Date
进行转换。它用预定义的字符串表示格式化:
- yyyy:年
- MM:月
- dd: 日
- HH: 小时
- mm: 分钟
- ss: 秒
我们来看如何以自定义的格式输出:
Java的格式化预定义了许多不同的格式,我们以MMM
和E
为例:
上述代码在不同的语言环境会打印出类似Sun Sep 15, 2019
这样的日期。可以从JDK文档查看详细的格式说明。一般来说,字母越长,输出越长。以M
为例,假设当前月份是9月:
M
:输出9
MM
:输出09
MMM
:输出Sep
MMMM
:输出September
Date
对象有几个严重的问题:它不能转换时区,除了toGMTString()
可以按GMT+0:00
输出外,Date总是以当前计算机系统的默认时区为基础进行输出。此外,我们也很难对日期和时间进行加减,计算两个日期相差多少天,计算某个月第一个星期一的日期等。
Calendar
Calendar
可以用于获取并设置年、月、日、时、分、秒,它和Date
比,主要多了一个可以做简单的日期和时间运算的功能。
我们来看Calendar
的基本用法:
注意到Calendar
获取年月日这些信息变成了get(int field)
,返回的年份不必转换,返回的月份仍然要加1,返回的星期要特别注意,1
~7
分别表示周日,周一,……,周六。
Calendar
只有一种方式获取,即Calendar.getInstance()
,而且一获取到就是当前时间。如果我们想给它设置成特定的一个日期和时间,就必须先清除所有字段:
利用Calendar.getTime()
可以将一个Calendar
对象转换成Date
对象,然后就可以用SimpleDateFormat
进行格式化了。
TimeZone
Calendar
和Date
相比,它提供了时区转换的功能。时区用TimeZone
对象表示:
时区的唯一标识是以字符串表示的ID,我们获取指定TimeZone
对象也是以这个ID为参数获取,GMT+09:00
、Asia/Shanghai
都是有效的时区ID。要列出系统支持的所有ID,请使用TimeZone.getAvailableIDs()
。
有了时区,我们就可以对指定时间进行转换。例如,下面的例子演示了如何将北京时间2019-11-20 8:15:00
转换为纽约时间:
可见,利用Calendar
进行时区转换的步骤是:
- 清除所有字段;
- 设定指定时区;
- 设定日期和时间;
- 创建
SimpleDateFormat
并设定目标时区; - 格式化获取的
Date
对象(注意Date
对象无时区信息,时区信息存储在SimpleDateFormat
中)。
因此,本质上时区转换只能通过SimpleDateFormat
在显示的时候完成。
Calendar
也可以对日期和时间进行简单的加减:
小结
计算机表示的时间是以整数表示的时间戳存储的,即Epoch Time,Java使用long
型来表示以毫秒为单位的时间戳,通过System.currentTimeMillis()
获取当前时间戳。
Java有两套日期和时间的API:
- 旧的Date、Calendar和TimeZone;
- 新的LocalDateTime、ZonedDateTime、ZoneId等。
分别位于java.util
和java.time
包中。