基于python的大数据分析实战学习笔记-pandas(数据分析包)-创新互联
pandas是什么呢?可能大家会看到各种解释,其实ta就是一个数据分析包啊。。。。。没啥可解释的
成都创新互联公司从2013年创立,是专业互联网技术服务公司,拥有项目成都网站建设、成都网站设计网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元临桂做网站,已为上家服务,为临桂各地企业和个人服务,联系电话:18982081108pandas中常见的数据结构有三种,Series(一维数组,也叫序列),DataFrame(二维表格,类似excel多行多列),Panel(三维数组)
那什么是数据结构呢?就是相互之间存在的一种或多种特定关系的数据类型的集合。
好了,概念就是这么简单,相信有python基础的朋友应该很容易理解,如果你没有。。。。恩。。。就没有吧
今天我们先来介绍下Series的用法,直接撸代码,里面有注释
from pandas import Series #定义一个序列 """ 一个序列可以存放不同的数据类型,索引index也是可以忽略的,可以通过下标访问(从0开始) 运行可能会报错: ImportError: C extension: No module named 'pandas._libs.tslib' not built. If you want to import pandas from the source directory, you may need to run 'python setup.py build_ext --inplace --force' to build the C extensions first. 解决方法: 先 pip3 uninstall pandas 在 pip3 install --user pandas """ x=Series(['a',True,1],index=['first','second','thrid']) print('通过下标取值',x[1]) print('通过索引取值',x['second']) #x[3] 不能越界访问会报错 #x.append(666)#不能追加单个元素 n=Series([666],index=['fourth'])#可以追加一个序列 print('新增序列之后',x.append(n)) if 1 in x.values: print('good') #切片 print('切片:',x[1:3]) #定位获取,常用于随机抽样 print(x[[0,2,1]]) #删除 #x.drop(0)#根据下标 #x.drop('first')#根据索引 #按照下标找到索引名 print(x.index[2]) #根据值删除,返回新序列 #x[2!=x.values #修改值 x.index[True==x.values] #将字典转为series #Series(字典格式) #对index进行排序 y=Series([2,3,1,5],index=['a','c','b','d']) print(y.sort_index(ascending=True))#ascending控制升还是降
OS:写代码虽然累,但确实爽,你还不体验下?
当前文章:基于python的大数据分析实战学习笔记-pandas(数据分析包)-创新互联
文章分享:http://ybzwz.com/article/hcigc.html