系统城装机大师 - 固镇县祥瑞电脑科技销售部宣传站!

当前位置:首页 > 网络编程 > 正则表达式 > 详细页面

python 正则表达式获取字符串中所有的日期和时间

时间:2020-02-04来源:系统城作者:电脑系统城

提取日期前的处理

1.处理文本数据的日期格式统一化


 
  1. text = "2015年8月31日,衢州元立金属制品有限公司仓储公司(以下简称元立仓储公司)成品仓库发生一起物体打击事故,造成直接经济损失95万元。"
  2. text1 = "2015/12/28下达行政处罚决定书"
  3. text2 = "2015年8月发生一起物体打击事故"
  4. # 对文本处理一下 # 2015-8-31 2015-12-28
  5. text = text.replace("年", "-").replace("月", "-").replace("日", " ").replace("/", "-").strip()

2.提取时间的正则表达式


 
  1. # 2019年10月27日 9:46:21
  2. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2})"
  3. # 2019年10月27日 9:46"
  4. "(\d{4}-\d{1,2}-\d{1,2})"
  5. # 2019年10月27日
  6. "(\d{4}-\d{1,2}-\d{1,2})"
  7. # 2019年10月
  8. "(\d{4}-\d{1,2})"

3.对其进行封装


 
  1. def get_strtime(text):
  2. text = text.replace("年", "-").replace("月", "-").replace("日", " ").replace("/", "-").strip()
  3. text = re.sub("\s+", " ", text)
  4. t = ""
  5. regex_list = [
  6. # 2013年8月15日 22:46:21
  7. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2})",
  8. # "2013年8月15日 22:46"
  9. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2})",
  10. # "2014年5月11日"
  11. "(\d{4}-\d{1,2}-\d{1,2})",
  12. # "2014年5月"
  13. "(\d{4}-\d{1,2})",
  14. ]
  15. for regex in regex_list:
  16. t = re.search(regex, text)
  17. if t:
  18. t = t.group(1)
  19. return t
  20. else:
  21. print("没有获取到有效日期")
  22.  
  23. return t

ps:下面看下python提取字符串中日期


 
  1. import re
  2. #删除字符串中的中文字符
  3. def subChar(str):
  4. match=re.compile(u'[\u4e00-\u9fa5]')
  5. return match.sub('',str)
  6.  
  7. #提取日期
  8. def extractDate(str):
  9. if not str:
  10. return None
  11. raw=subChar(str)
  12. if not raw:
  13. return None
  14. #提取前10位字符
  15. rawdate=raw[:10]
  16. datelist=re.findall("\d+",rawdate)
  17. if not datelist:
  18. return None
  19. if datelist.__len__()==3:
  20. if (float(datelist[0])>2099 or float(datelist[0])<1900) or float(datelist[1])>12 orfloat(datelist[2])>31:
  21. return None
  22. else:
  23. return '-'.join(datelist)
  24. if datelist.__len__()==2:
  25. if (float(datelist[0])>2099 or float(datelist[0])<1900) or float(datelist[1])>12:
  26. return None
  27. else:
  28. datelist.append('01')
  29. return '-'.join(datelist)
  30. if datelist.__len__()==1:
  31. if float(datelist[0])>20991231 or float(datelist[0])<19000101:
  32. return None
  33. else:
  34. return datelist[0]
  35. return None

总结

以上所述是小编给大家介绍的python 正则表达式获取字符串中所有的日期和时间,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

分享到:

相关信息

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载