import pandas as pd import numpy as np # 计算用户对歌曲的播放比例 triplet_dataset_sub_song_merged_sum_df = triplet_dataset_sub_song_mergedpd[['user', 'listen_count']].groupby('user').sum().reset_index() triplet_dataset_sub_song_merged_sum_df.rename(columns={'listen_count': 'total_listen_count'}, inplace=True) triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_mergedpd, triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_mergedpd['fractional_play_count'] = triplet_dataset_sub_song_mergedpd['listen_count'] / triplet_dataset_sub_song_merged['total_listen_count'] # 将用户和歌曲编码为数字 small_set = triplet_dataset_sub_song_mergedpd user_codes = small_set.user.drop_duplicates().reset_index() song_codes = small_set.song.drop_duplicates().reset_index() user_codes.rename(columns={'index': 'user_index'}, inplace=True) song_codes.rename(columns={'index': 'song_index'}, inplace=True) song_codes['so_index_value'] = list(song_codes.index) user_codes['us_index_value'] = list(user_codes.index) small_set = pd.merge(small_set, song_codes, how='left') small_set = pd.merge(small_set, user_codes, how='left') # 将数据转换为稀疏矩阵形式 from scipy.sparse import coo_matrix mat_candidate = small_set[['us_index_value', 'so_index_value', 'fractional_play_count']] data_array = mat_candidate.fractional_play_count.values row_array = mat_candidate.us_index_value.values col_array = mat_candidate.so_index_value.values data_sparse = coo_matrix((data_array, (row_array, col_array)), dtype=float) # 使用SVD方法进行矩阵分解并进行推荐 from scipy.sparse import csc_matrix from scipy.sparse.linalg import svds import math as mt def compute_svd(urm, K): U, s, Vt = svds(urm, K) dim = (len(s), len(s)) S = np.zeros(dim, dtype=np.float32) for i in range(0, len(s)): S[i, i] = mt.sqrt(s[i]) U = csc_matrix(U, dtype=np.float32) S = csc_matrix(S, dtype=np.float32) Vt = csc_matrix(Vt, dtype=np.float32) return U, S, Vt def compute_estimated_matrix(urm, U, S, Vt, uTest, K, test): rightTerm = S * Vt max_recommendation = 250 estimatedRatings = np.zeros(shape=(MAX_UID, MAX_PID), dtype=np.float16) recomendRatings = np.zeros(shape=(MAX_UID, max_recommendation), dtype=np.float16) for userTest in uTest: prod = U[userTest, :] * rightTerm estimatedRatings[userTest, :] = prod.todense() recomendRatings[userTest, :] = (-estimatedRatings[userTest, :]).argsort()[:max_recommendation] return recomendRatings K = 50 urm = data_sparse MAX_PID = urm.shape[1] MAX_UID = urm.shape[0] U, S, Vt = compute_svd(urm, K) uTest = [4, 5, 6, 7, 8, 73, 23] # uTest=[1b5bb32767963cbc215d27a24fef1aa01e933025] uTest_recommended_items = compute_estimated_matrix(urm, U, S, Vt 继续将这段代码输出完整

import pandas as pd import math as mt import numpy as np from sklearn.model_selection import train_test_split from Recommenders import SVDRecommender triplet_dataset_sub_song_merged = triplet_dataset_sub_song_mergedpd triplet_dataset_sub_song_merged_sum_df = triplet_dataset_sub_song_merged[['user','listen_count']].groupby('user').sum().reset_index() triplet_dataset_sub_song_merged_sum_df.rename(columns={'listen_count':'total_listen_count'},inplace=True) triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_merged,triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_merged['fractional_play_count'] = triplet_dataset_sub_song_merged['listen_count']/triplet_dataset_sub_song_merged small_set = triplet_dataset_sub_song_merged user_codes = small_set.user.drop_duplicates().reset_index() song_codes = small_set.song.drop_duplicates().reset_index() user_codes.rename(columns={'index':'user_index'}, inplace=True) song_codes.rename(columns={'index':'song_index'}, inplace=True) song_codes['so_index_value'] = list(song_codes.index) user_codes['us_index_value'] = list(user_codes.index) small_set = pd.merge(small_set,song_codes,how='left') small_set = pd.merge(small_set,user_codes,how='left') mat_candidate = small_set[['us_index_value','so_index_value','fractional_play_count']] data_array = mat_candidate.fractional_play_count.values row_array = mat_candidate.us_index_value.values col_array = mat_candidate.so_index_value.values data_sparse = coo_matrix((data_array, (row_array, col_array)),dtype=float) K=50 urm = data_sparse MAX_PID = urm.shape[1] MAX_UID = urm.shape[0] recommender = SVDRecommender(K) U, S, Vt = recommender.fit(urm) Compute recommendations for test users uTest = [1,6,7,8,23] uTest_recommended_items = recommender.recommend(uTest, urm, 10) Output recommended songs in a dataframe recommendations = pd.DataFrame(columns=['user','song', 'score','rank']) for user in uTest: rank = 1 for song_index in uTest_recommended_items[user, 0:10]: song = small_set.loc[small_set['so_index_value'] == song_index].iloc[0] # Get song details recommendations = recommendations.append({'user': user, 'song': song['title'], 'score': song['fractional_play_count'], 'rank': rank}, ignore_index=True) rank += 1 display(recommendations)这段代码报错了，为什么？给出修改后的代码

triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_merged,triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_merged['fractional_play_count'] = triplet_dataset_sub_song_...

import pandas as pd.docx

import pandas as pd - **说明**：此行代码导入了 Pandas 库，并将其别名为 pd，这是 Pandas 的常用命名方式。 #### 2. 构造模拟数据 - **知识点**：通过字典构造 DataFrame。 - **示例代码**： python...

import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip

这个压缩包文件"import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip"包含了使用Python的NumPy库进行SPI计算的代码，以及可能的MATLAB实现。首先，我们要了解NumPy在Python中的重要性。...

Numpy及Pandas_numpy_pandas_dataframe_python_

Numpy和Pandas是Python中两个非常重要的数据分析和处理库，它们在科学计算领域有着广泛的应用。Numpy主要处理多维数组对象，而Pandas则在此基础上构建了更高级的数据结构，如DataFrame，用于进行数据清洗、分析和...

03_NumPy_and_Pandas_pandas_

标题 "03_NumPy_and_Pandas_pandas_" 暗示了这个压缩包包含的是关于NumPy和Pandas库的基础知识。这两个库是Python中数据分析和处理的核心工具，特别是对于处理大型数据集非常有用。Pandas是建立在NumPy之上的，提供...

numpy-1.19.5-cp##-cp##-win_amd64.rar

pip install numpy-*** 选择对应的离线安装包 numpy-1.19.5-cp36-cp36m-win_amd64.whl numpy-1.19.5-cp37-cp37m-win_amd64.whl numpy-1.19.5-cp38-cp38m-win_amd64.whl numpy-1.19.5-cp39-cp39m-win_amd64.whl

import numpy as.docx

在Python编程语言中，numpy 是一个非常重要的科学计算库，它提供了强大的数组操作功能。在本示例中，我们看到代码导入了numpy库，并用别名 np 来引用它。这样做的目的是方便后续代码中调用numpy的功能，如创建、...

dataanaly 2_numpy_pandas_python3数据库_python_产品经理_

包含数据的基本处理运算拟合数据展现 Python3.6及以上版本 anoconda管理Python环境文件夹day01 包含向量元组 pandas的基本用法及部分数据的分析过程和示例文件夹plot 包含plot的绘制示例文件夹pyweb 以webpy...

pandas_numpy_seed.ipynb

seed()方法在去随机数在下次编译不会重置，即得到的值是一样的

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_

import numpy/pandas in python-d 错误解决

对于开发版本的python存在numpy和pandas无法正常导入的问题，卸载原有的numpy和pandas，将文件夹内内容拷贝到python_d.exe所在目录下的Lib/site-packages目录下

基于Python开发的金融数据接口工具_支持TuShare金融数据接口调用_集成pandas数据处理和NumPy数值计算_提供Matplotlib可视化功能_兼容Python2和3.zip

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

import pandas as pd # 假设df是我们的数据集 df = pd.read_csv('your_dataset.csv') # 设置训练集和测试集的比例，例如80%的数据用于训练，20%用于测试 train_size = 0.8 test_size = 1 - train_size # 使用随机...

Python_mat.numpy.pandas-numpy

本文档所提及的标题“Python_mat.numpy.pandas-numpy”暗示了文档内容很可能与Python的数据处理库有关，而特别强调了“numpy”这一关键字。通过分析标题和文件列表，我们可以推断这份材料将涉及Python编程语言中的...

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码.zip

标题中的"dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码"表明这是一个关于数据分析的项目，主要使用的工具是NumPy、Pandas和Python，这是一门强大的科学计算库组合，广泛应用于数据预处理、清洗、分析...

perl-Test-Compile-2.2.2-2.el8.tar.gz

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

swagger-models-jakarta-2.2.30.jar中文-英文对照文档.zip

1、压缩文件中包含：中文-英文对照文档、jar包下载地址、Maven依赖、Gradle依赖、源代码下载地址。 2、使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 3、特殊说明：（1）本文档为人性化翻译，精心制作，请放心使用；（2）只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等；（3）不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 4、温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件。 5、本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册。

SAP HANA Express 版本的注册和安装

Register for SAP HANA, express edition 虚拟机 (VM) 安装方法是最简单的 SAP HANA 2.0 快速版本地安装方法，适用于兼容的 Windows、OS X 和 Linux 笔记本电脑。在注册之前，请先执行这些预安装任务。 SAP HANA 2.0 快速版 VM 映像与平台无关。您可以将其安装到 Windows、OS X 或 Linux 计算机上，前提是您的笔记本电脑满足存储和内存先决条件。如果您想要最简单的本地安装体验，请选择 VM 安装方法。虚拟机方法

【微擎小程序】柚子房产小程序 yzfc_sun 1.0.5.zip

资源说明： 1：本资料仅用作交流学习参考，请切勿用于商业用途。 2：一套精品微擎小程序源码资源，无论......

相关推荐

python数据分析与可视化 import pandas as pd import numpy as np import m

numpy-2.3.0-cp312-cp312-win_amd64.whl

numpy-2.3.0-cp313-cp313-win_amd64.whl

import pandas as pd.docx

import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip

Numpy及Pandas_numpy_pandas_dataframe_python_

03_NumPy_and_Pandas_pandas_

numpy-1.19.5-cp##-cp##-win_amd64.rar

import numpy as.docx

dataanaly 2_numpy_pandas_python3数据库_python_产品经理_

pandas_numpy_seed.ipynb

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_

import numpy/pandas in python-d 错误解决

基于Python开发的金融数据接口工具_支持TuShare金融数据接口调用_集成pandas数据处理和NumPy数值计算_提供Matplotlib可视化功能_兼容Python2和3.zip

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

Python_mat.numpy.pandas-numpy

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码.zip

perl-Test-Compile-2.2.2-2.el8.tar.gz

swagger-models-jakarta-2.2.30.jar中文-英文对照文档.zip

SAP HANA Express 版本的注册和安装

【微擎小程序】柚子房产小程序 yzfc_sun 1.0.5.zip

大家在看

围兜

CP1H任务密码

vlcBFQ.rar

N4BiasFieldCorrection:这是MRI的N4偏场校正

labview pdf toolkit

最新推荐

python中时间转换datetime和pd.to_datetime详析

pandas中read_csv的缺失值处理方式

Pandas的read_csv函数参数分析详解

perl-Test-Compile-2.2.2-2.el8.tar.gz

swagger-models-jakarta-2.2.30.jar中文-英文对照文档.zip

HTML时间格式化工具及测试页面介绍

Elixir测试：从用例执行到覆盖率分析

Android Studio 时间延时

IMS Open Corpus Workbench：打造高效大型文本语料库管理工具

基于属性测试的深入解析与策略探讨