- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
掌握数据的读取方式;;常见的数据储存媒介有数据库和文件,以下介绍如何读取数据库数据和文件数据。
在生产环境中,绝大多数的数据都存储在数据库中。
想要读取数据库中的数据需要先与数据库建立连接。
数据库连接是分析工具与数据库之间的通道,只有建立数据库连接后,用户才能对数据库中的数据进行操作。
Python也需要与数据库建立连接后才能读取数据库中的数据,一个常用建立连接的方法为通过SQLAlchemy库并配合相应数据库的Python连接工具。
;不同的数据库需要选择对应的连接工具,如MySQL数据库需要安装mysqlclient或pymysql库,Oracle数据库需要安装cx_oracle库。
SQLAlchemy库支持与MySQL、postgresql、Oracle、SQLServer和SQLite等主流数据库建立连接。
建立连接时需要提供数据库产品名、连接工具名、用户名、密码、数据库IP地址、数据库端口号、数据库名称。
同时还需要注意数据库中使用的数据编码,使用错误的编码会导致乱码问题。
使用SQLAlchemy连接MySQL数据库,与数据库进行连接后,可以与数据库进行交互,对数据库中的数据进行操作。;使用SQLAlchemy连接MySQL数据库,与数据库进行连接后,可以与数据库进行交互,对数据库中的数据进行操作。
常见的操作包括读取、存储以及增、删、改、查等,通过pandas库对数据库进行读取和存储操作,得到结果。
;;另一种常见的数据载体是文本文件,文本文件是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。
常见的有TXT文件和CSV文件,这两种文件的主要区别是TXT文件使用空格分隔,而CSV是一种逗号分隔的文件格式。
因为CSV文件分隔符不一定是逗号,所以又被称为字符分隔文件,文件以纯文本形式存储表格数据(数字和文本)。
CSV是一种通用、相对简单的文件格式,最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的或无规范的格式)。;因为大量程序都支持CSV或其变体,所以可以作为大多数程序的输入和输出格式。
CSV文件根据其定义也是一种文本文件,在数据读取过程中可以使用文本文件的读取函数对CSV文件进行读取。
使用read_table和read_csv函数读取CSV文??,读取文件时需要注意编码问题,常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等。
如果编码指定错误,那么数据将无法读取,IPython解释器会报解析错误。使用不同的参数读取二手车售价表,除了TXT文件和CSV文件外,Excel文件也是常见的需要读取的数据文件种类。;Excel可以进行各种数据的处理、统计分析和辅助决策操作,被广泛地应用于管理、统计财经和金融等众多领域。
其文件格式依照程序版本的不同分为以下两种。
Microsoft Office Excel 2007之前的版本(不包括2007)默认保存的文件名后缀为.xls。
Microsoft Office Excel 2007之后的版本默认保存的文件名后缀为.xlsx。
通过pandas库读取xlsx格式的伦敦自行车租赁表,得到结果。;本章主要对常见的数据来源进行了简要的介绍,常见的数据来源主要分为直接来源和间接来源两种。
大致描述了交通信息的采集,如交通信息的分类和特点以及交通信息的采集技术。
还介绍了常见的数据类型,包括结构化、半结构化和非结构化数据。
最后介绍了数据的读取方式,主要包括读取数据库数据和读取文件数据。
掌握数据的读取方式;;常见的数据储存媒介有数据库和文件,以下介绍如何读取数据库数据和文件数据。
在生产环境中,绝大多数的数据都存储在数据库中。
想要读取数据库中的数据需要先与数据库建立连接。
数据库连接是分析工具与数据库之间的通道,只有建立数据库连接后,用户才能对数据库中的数据进行操作。
Python也需要与数据库建立连接后才能读取数据库中的数据,一个常用建立连接的方法为通过SQLAlchemy库并配合相应数据库的Python连接工具。
;不同的数据库需要选择对应的连接工具,如MySQL数据库需要安装mysqlclient或pymysql库,Oracle数据库需要安装cx_oracle库。
SQLAlchemy库支持与MySQL、postgresql、Oracle、SQLServer和SQLite等主流数据库建立连接。
建立连接时需要提供数据库产品名、连接工具名、用户名、密码、数据库IP地址、数据库端口号、数据库名称。
同时还需要注意数据库中使用的数据编码,使用错误的编码会导致乱码问题。
使用SQLAlchemy连接MySQL数据库,与数据库进行连接后,可以与数据库进行交互,对数据库中的数据进行操作。;使用S
您可能关注的文档
- Python数据分析基础与案例实战 课件 第6章 6.2 构建聚类模型.pptx
- Python数据分析基础与案例实战 课件 第6章 6.3 构建时间序列模型.pptx
- Python数据分析基础与案例实战 课件 第8章 公交车站点设置优化分析.pptx
- Python数据分析基础与案例实战 课件 第9章 铁路站点客流量预测.pptx
- Python数据分析基础与案例实战 课件 第10章 基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析.pptx
- Python数据分析基础与案例实战 课件 第7章 运输车辆驾驶行为分析.pptx
- Python数据分析基础与案例实战 课件 第1章 1.1 了解交通大数据.pptx
- Python数据分析基础与案例实战 课件 第2章 Python数据分析简介.pptx
- Python数据分析基础与案例实战 课件 第3章 3.1了解常见的数据来源.pptx
- Python数据分析基础与案例实战 课件 第3章 3.2 数据获取.pptx
- 在新闻宣传与舆论引导专题培训班上的讲话(6篇).docx
- 乡村振兴发展村集体经济范文七篇.docx
- 2023年自考类医学类精神障碍护理学历年真题荟萃带答案难题附详解.docx
- 2023年医学类A兽医资格历年真题荟萃带答案难题附详解.docx
- 2023年研究生类研究生入学考试专业课计算机学科专业综合基础-数据结构历年真题荟萃带答案难题附详解.docx
- 2023年研究生类研究生入学考试专业课普通化学2010-2022历年真题选编带答案难题含解析.docx
- 2023年研究生类研究生入学考试专业课心理学专业实验心理学历年真题荟萃带答案难题附详解.docx
- 2023年研究生类经济类联考专业硕士综合能力2010-2022历年真题选编带答案难题含解析.docx
- 2023年法律硕士联考综合课法学历年真题荟萃带答案难题附详解.docx
- 2023年自考类电子商务专业互联网软件应用与开发2010-2022历年真题选编带答案难题含解析.docx
文档评论(0)