时间:2022-12-10来源:www.pcxitongcheng.com作者:电脑系统城
PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是以加州大学计算机系开发的POSTGRES,4.2版本为基础的对象关系型数据库管理系统。POSTGRES的许多领先概念只是在比较迟的时候才出现在商业网站数据库中。PostgreSQL支持大部分的SQL标准并且提供了很多其他现代特性,如复杂查询、外键、触发器、视图、事务完整性、多版本并发控制等。同样,PostgreSQL也可以用许多方法扩展,例如通过增加新的数据类型、函数、操作符、聚集函数、索引方法、过程语言等。另外,因为许可证的灵活,任何人都可以以任何目的免费使用、修改和分发PostgreSQL。
以前抽数据都是从其他数据库抽取到postgres数据库的所以选择kettle。新项目需求里需要把客户给的csv文件数据抽到postgresql,其中还需要对相关字段进行清洗。先声明下kettle也可以实现,但是总感觉依赖第三方软件抽数据不如直接操作数据库,除非逼不得已,尽量不用(纯属个人见解)。于是就研究linux直接连接数据库处理这部分需求。代码如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
#!/bin/bash # ***************************************************** # ** linux_schedule_test # ***************************************************** #\copy test from '/etl-script/test.csv' delimiter ',' csv header encoding 'UTF8'; # copy test_copy to 'D:\test_copy1.csv' delimiter ',' csv header encoding 'GBK'; export PATH= /usr/pgsql-10/bin : /usr/bin ; psql "host=127.0.0.1 port=5434 user=admin password=123456 dbname=linux_schedule_test" << EOF #2>/dev/null \copy test from '/etl-script/test.csv' delimiter ',' csv header encoding 'GBK' ; create table test $( date +%Y%m%d_%H%m%S) as select * from test ; \q EOF |
export PATH=/usr/pgsql-10/bin:/usr/bin :因为环境作用域问题,最好在脚本开始处将要用到的命令添加PATH路径。
psql "host=127.0.0.1 port=5434 user=admin password=123456 dbname=linux_schedule_test" :连接数据库
<< EOF : 通过重定向,停留在psql客户端。
#2>/dev/null 脚本出错不输出,调试时建议注释掉,不然都不知道脚本为什么没有跑。
\copy test from '/etl-script/test.csv' delimiter ',' csv header encoding 'GBK';:通过copy命令抽取csv文件数据。
create table test$(date +%Y%m%d_%H%m%S) as select * from test;:备份test表数据,测试用的。
\q:退出psql。这个不写也可以最后的EOF也会接受psql客户端的。
EOF:结束重定向。
2022-09-11
Windows 系统 PostgreSQL 手工安装配置方法教程图解2022-02-25
系统城教小白如何在Centos8-stream安装PostgreSQL132021-04-22
自定义函数实现单词排序并运用于PostgreSQL(实现代码)