R中对于日期型数据的处理
-
从csv文件中读取data.frame的时候,如果某一列是时间(例如2020/3/27),它会被当作string字符串读取进数据表。那么如何把字符串转换为时间呢?
R中,标准的时间格式为年-月-日,例如2019-01-20,因此,如果你的数据中时间格式和这个相同,可以直接用
as.Date(“2019-01-20”)
进行转化。当日期格式不标准的时候,可以加入一个参数:format来表示数据中的日期格式
假如说日期是日/月/四位数年,则用
as.Date("01/02/2019",format="%d/%m/%Y")
其中%d,%m,%Y和其它可用code的含义如下表所示Code Meaning Code Meaning %a Abbreviated weekday %A Full weekday %b Abbreviated month %B Full month %c Locale-specific date and time %d Decimal date %H Decimal hours (24 hour) %I Decimal hours (12 hour) %j Decimal day of the year %m Decimal month %M Decimal minute %p Locale-specific AM/PM %S Decimal second %U Decimal week of the year (starting on Sunday) %w Decimal Weekday (0=Sunday) %W Decimal week of the year %x Locale-specific Date %X Locale-specific Time %y 2-digit year %Y 4-digit year %z Offset from GMT %Z Time zone (character)
-
注意,如果有一些数据无法转换为日期格式,as.Date会给出NA,但是不会有警告
所以我们也可以用另一个著名的用来处理日期的包,lubridate,语法为
parse_date_time(表名称$列名称,"%d/%m/%Y")
这个函数会对没能转换的值提出警告:
Warning message:
1 failed to parse.这个包的参考文件如下:
lubridate.pdf lubridate cheatsheet.pdf
1 / 2