import numpy as np
import pandas as pd
import matplotlib.dates as mdates
from datetime import datetime
from statsmodels.tsa.seasonal import seasonal_decompose
import os
# print(data_x)
# 热力图-------------
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
import numpy as np
import pandas as pd
import re
import matplotlib.dates as mdates
from datetime import datetime
from statsmodels.tsa.seasonal import seasonal_decompose
import os
# print(data_x)
# 热力图-------------
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
datas = pd.read_excel("K线导出_000001_日线数据(1).xls")
# ['证券代码', '证券名称', '交易时间', '开盘价', '最高价', '最低价', '收盘价', '涨跌', '涨跌幅%', '成交量',
# '成交额']
print(datas.columns)
data=datas[['开盘价', '最高价', '最低价', '收盘价', '涨跌',
'涨跌幅%', '成交量']]
print(data.head(5))
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
plt.subplots(figsize=(20, 50))
print(data.corr())
sns.heatmap(
data.corr(
method='spearman').round(5), annot=True)
plt.show()
# 使用seaborn和matplotlib绘制箱线图
plt.figure(figsize=(10, 6))
# 绘制箱线图
sns.boxplot(data=data[['开盘价', '最高价', '最低价', '收盘价', '涨跌',
'涨跌幅%']])
# 添加标题和标签
plt.title('特征分布箱线图')
plt.xlabel('特征')
plt.ylabel('值')
# 显示图形
plt.show()
# 示例数据
time_points =datas['交易时间'].values[:100]
# 创建折线图
plt.plot(time_points,datas['最低价'].values[:100] , marker='^', linestyle='-', color='blue', label='Line 最低')
plt.plot(time_points,datas['收盘价'].values[:100] , marker='p', linestyle='-', color='orange', label='Line 收盘')
# 设置图形标题和坐标轴标签
plt.title('最低-收盘趋势图')
plt.xlabel('时间')
plt.ylabel('值')
# 显示图例
plt.legend()
# 显示图形
plt.show()
# 创建折线图
plt.plot(time_points,datas['开盘价'].values[:100] , marker='+', linestyle='-', color='blue', label='Line 开盘')
plt.plot(time_points,datas['最高价'].values[:100] , marker='*', linestyle='-', color='orange', label='Line 最高')
# 设置图形标题和坐标轴标签
plt.title('开盘-最高趋势图')
plt.xlabel('时间')
plt.ylabel('值')
# 显示图例
plt.legend()
# 显示图形
plt.show()
# data_x = np.isinf(data) # 处理数据中的异常值
# data_x=np.array(data_x,dtype=np.float16)
# 示例数据,你可以替换为你自己的数据
timestamps =[i for i in range(len(data['收盘价'].values))]
values = data['收盘价'].values
# 计算均值
mean = np.mean(values)
# 计算中位数
median = np.median(values)
# 计算标准差
std_dev = np.std(values)
# 计算方差
variance = np.var(values)
print(f"均值:{mean}")
print(f"中位数:{median}")
print(f"标准差:{std_dev}")
print(f"方差:{variance}")
# 设置图形大小import matplotlib.dates as mdates
# 创建箱线图
plt.figure(figsize=(6, 4))
sns.boxplot(data=values,color='orange')
plt.title('箱线图')
plt.show()
# 使用 seaborn 绘制核密度估计图
sns.kdeplot(values, shade=True,color='orange')
# 或者使用 sns.displot(data, kind='kde') # 绘制核密度估计图(新版 seaborn 中的 displot)
# 设置图表标题和标签
plt.title('密度图')
plt.xlabel('数据值')
plt.ylabel('密度')
# 显示图表
plt.show()
# 使用 seaborn 绘制小提琴图
sns.violinplot(data=values,color='orange')
# 设置图表标题和标签
plt.title('小提琴图')
plt.ylabel('数据值')
# 显示图表
plt.show()
# 计算特征与目标列的相关性
correlation_matrix = data.corr()
correlation_with_target = correlation_matrix['收盘价'].abs().sort_values(ascending=False)
# 筛选与目标列相关性较高的特征
selected_features = correlation_with_target[correlation_with_target > 0.5].index
# 打印相关性排序
print("特征与目标列的相关性排序close:")
print(correlation_with_target)
# 绘制柱状图显示相关性
plt.figure(figsize=(10, 6))
sns.barplot(x=correlation_with_target.values, y=correlation_with_target.index, palette='viridis')
plt.title('Feature Correlation with 收盘价')
plt.xlabel('Correlation')
plt.ylabel('Feature')
plt.show()

程序员奇奇
- 粉丝: 3w+
最新资源
- 电子科技大学2021年9月《计算机操作系统》作业考核试题及答案参考20.docx
- 第二讲项目管理-软件改进过程知识讲解.ppt
- 基于元数据可追溯性的健康医疗大数据分析.docx
- 点画面步骤出现选择方块选永远允许来自这个网站的快说课材料.ppt
- 《光纤通信》试题计算分析题练习培训资料.docx
- 2023年通信工程师考试综合能力试题模板.doc
- 软件工程师工作总结精选(1).docx
- 大数据在固体废物管理中的应用.docx
- 十章数据库恢复技术培训讲学.ppt
- 单片机病房呼叫器文章教材课程.doc
- RC建筑结构设计图及材料估算之自动化研究复习课程.ppt
- 互联网部绩效考核制度(2).doc
- 2021年9月《机械CAD技术基础》作业考核试题及答案参考11.docx
- 企业电子商务解决方案.ppt
- 基于生产管理的企业信息化研究的开题报告.docx
- 软件工程期末考试参考试题.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


