南京普顿大学 吴琦琦

姓名:吴琦琦

专业:南京普顿大学 营销分析

项目:Python量化投资实训营学员

通过几周的量化新兵课程以及自己课后的补充学习,我基本了解并初步掌握了Python数据处理的知识和技能,主要包括Numpy库、Pandas库和Matplotlib库。在学习的过程中,我深切感受到了量化投资以及数据处理的魅力,感受到了自身能力兴趣与其的契合度,并坚定了自己未来的职业发展方向。

关于量化课程,我很喜欢老师的讲课风格,清晰利索节奏快。虽然对于我这种编程小白来说,听后半部分的课时略微有些吃力,但是通过课前课后查找资料补充基础知识,我也能较好地掌握相关知识。所以总的来说,我很喜欢本次课程,也从中受益良多。同时,我也很希望能通过量化新兵的计划的考核,进行实地实习,得到更多实操锻炼的机会,从而提升自己。

我的笔记:

1、Series是带标签的一维数组,可存储整数、浮点数、字符串、Python对象等类型的数据。轴标签统称为索引。

2、DataFrame是由多种类型的列构成的二维标签数据结构,类似于Excel、SQL、Series对象构成的字典等。DateFrame是最常见的Pandas对象,与Series一样,DataFrame支持多种类型的输入数据。

3、数据处理中,ffill是缺失的地方等于上一个值,bfill是缺失的地方等于下一个值。

4、NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。

5、关于DataFrame的缺失数据处理,dropna(how=’all’)表示行的所有值为NaN才删除行,dropna(how=’any’)表示行只要有NaN值就删除行。

6、关于Pannel的修改顺序函数transpose(n,m,z)中,n,m,z三个位置分别代表:n表示item(列名),m表示major(外索引),z表示minor(内索引)。关于Panel的顺序:0列名,1外索引,2内索引。Panel是三维数据,DataFrame是二维数据,Series是一维数据。只有Panel需要通过to_frame()方法以双索引的格式显示,其他两种可以直接显示。

7、Numpy转Series要添加索引index,主要是添加时间序列索引;Series转DataFrame要添加列名,即赋予每个Series一个key;DataFrame转Panel也要添加列名。

8、pd.read_csv(filename):从CSV文件导入数据。pd.read_excel(filename):从Excel文件导入数据;df.to_csv(filename):导出数据到CSV文件。df.to_excel(filename):导出数据到Excel文件。

相关新闻