最近在学python,正好看到一个讲解pandas的系列视频,正好做一下笔记,笔记会参考视频,同时也会参考pandas官方文档。
什么是pandas
pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.
完整的文档可以查看pandas的Cookbook
视频地址:bilibili-使用 pandas 进行数据分析:Data analysis in Python with pandas
环境安装
安装python环境
安装pandas python 环境的安装,可以看之前的文章,在centos7上安装python。
pandas安装: 1.Mac上使用brew brew cask install anaconda
2.python -m pip install pandas https://pypi.douban.com/simple/ 推荐使用第一种,anaconda的方式安装,比较方便 使用第二种的话,需要下载额外的一些包,需要根据实际情况进行下载,例如matplotlib
;
视频使用的资源 [百度网盘]](https://pan.baidu.com/s/1UVT_S9BHJZS8ktjAc8Xpcw ) 密码:dr78 (来自bilibili用户) 视频中的网络资源无法使用,可以使用上面百度网盘中的资源,或者使用我提供的地址
目录 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 import pandas as pd''' 因为视频中的地址不可用,可以用网盘中的文件,或者用我提供的文件地址''' orders = pd.read_table('https://blog.searchinfogo.com/download/data/data/chipotle.tsv' ) print (orders)head = orders.head() print (head)user_cols = ['user_id' , 'age' , 'gender' , 'occupation' , 'zip_code' ] users = pd.read_table("https://blog.searchinfogo.com/download/data/data/u.user" , sep='|' , header=None , names=user_cols) print (users)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 import pandas as pdufo = pd.read_csv('https://blog.searchinfogo.com/download/data/data/ufo.csv' ) type = type (ufo)print (type )ufo.head() type (ufo['City' ])print (ufo['City' ])ufo.shape ufo.City + ufo.State ufo['Location' ] = ufo.City + ',' + ufo.State print (ufo['Location' ])
总结: 上面的代码涉及视频p1-p3,讲解了pandas如何读取数据,从table、csv中读取数据,并在pandas中组合出一些数据,这些过程涉及 生产数据、获取数据、准备数据几个过程,在实际的使用过程中,用户的操作,或者是其他过程会产生大量的数据,然后获取数据读取到 pandas中,并对数据进行清洗,取出掉无效或者错误的数据,之后最数据进行更深入的分析。