当前位置: 首页 > wzjs >正文

网络公司建设网站国外免费网站服务器

网络公司建设网站,国外免费网站服务器,百度广告位价格表,网站 优化 件本博文继续研究如何利用大语言模型(LLM)来构建播客推荐系统。 使用mongoDB 数据看存储基本数据 播客表(Podcast)节目表(Episodes)用户表(User) 用户表(User) DeepSeek 笔记:推荐…

       

 本博文继续研究如何利用大语言模型(LLM)来构建播客推荐系统。

使用mongoDB 数据看存储基本数据

  1. 播客表(Podcast)
  2. 节目表(Episodes)
  3. 用户表(User)

用户表(User)

DeepSeek 笔记:推荐的spotify listener 记录格式

1. Basic Account Information

  • User ID: A unique identifier for the user (e.g., a Spotify-generated UUID).
  • Username: The display name chosen by the user.
  • Email Address: The email associated with the account.
  • Password: Encrypted for security.
  • Account Type: Free (ad-supported) or Premium (paid subscription).
  • Country/Region: The user's location, which may affect available content.
  • Date of Birth: Used for age verification and personalized content.
  • Account Creation Date: When the user signed up for Spotify.

2. Subscription and Payment Details

  • Subscription Status: Active, canceled, or trial.
  • Payment Method: Credit card, PayPal, etc.
  • Billing History: Records of past payments.
  • Renewal Date: For Premium users.

3. Usage and Activity Data

  • Listening History: Tracks, albums, and playlists the user has played.
  • Recently Played: A list of recently listened-to songs.
  • Playlists Created: User-generated playlists.
  • Followed Artists/Users: Artists or other users the user follows.
  • Liked Songs: Songs saved to the "Liked Songs" library.
  • Podcasts Subscribed To: Podcasts the user follows.
  • Device Information: Devices used to access Spotify (e.g., mobile, desktop, smart speaker).

4. Preferences and Settings

  • Language Preference: The user's chosen language for the app.
  • Privacy Settings: Whether the user's activity is public or private.
  • Audio Quality Settings: Streaming quality (e.g., low, normal, high, very high).
  • Explicit Content Filter: Whether explicit content is allowed.
  • Social Sharing Settings: Whether the user allows sharing activity on social media.

5. Analytics and Recommendations

  • Personalized Recommendations: Generated based on listening habits (e.g., Discover Weekly, Daily Mixes).
  • Top Tracks/Artists: Lists of the user's most-played songs and artists.
  • Listening Trends: Data on when and how often the user listens to music.

6. Security and Privacy

  • wo-Factor Authentication (2FA): Whether enabled.
  • Login History: Records of recent logins and devices used.
  • Data Sharing Preferences: Whether the user allows Spotify to share data with third parties.

从上面的信息中,截取一部分重要的部分,构建一个用户记录。

用户

UserSchema={UserID:String,Username:String,Email_Address:String,Password:String,CountryRegion:String,Date_of_Birth:String,Language:String,Account_Creation_Date:String,
}

收听历史(UserListenHistory)

UserListenHistorySchema={episodes_id:String,listen_time:String,//收听时间completion_rate:Numeric, //收听完成率(百分比)}

关注的播客(UserFllowingPodcast)

UserFllowingPodcastSchema={
Podcast_ID:String,
Fllowing_time:String,//关注的时间}

History ,Follow,Like 的列表可以数组的方式存储在听众表中 

UserSchema={UserID:String,Username:String,Email_Address:String,Password:String,CountryRegion:String,Date_of_Birth:String,Language:String,Account_Creation_Date:String,History:HistorySchema,Follows:followsSchema,Likes:likesSchema
}

播客表(Podcast)

podcastSchema={podcast:String,uuid:String,title:String,image:String,description:Stringlanguage:Stringcategories:String,website:String,itunes_id:String,follows:Numer               }

节目表(Epicodes)

   epicodeSchema={audio:String,audio_length:String,description:String,pub_date:String,uuid:String,podcast_uuid:String,likes:number
}

推荐算法

   使用Embedding 模型,矢量数据库实现相似性检索。

基本原则

  1.  用户通过相似性搜索,通过关键词,自然语言的提示,搜索心仪的播客节目,用户收听之后,这些节目将会加入收听历史列表中
  2. 计算用户的特征与电影的特征的相似度,列出前10个最相似的播客节目。
  3. 列出用户最近看过的前十部电影,计算出与这10部电影相似的播客节目,比如选择5部播客节目,一共列出10*5=50 部新的播客节目。
  4. 计算与用户的特征相似的其它用户,列出前10个相似的用户,找出相似用户看过的播客节目(每个用户选择2部),于是推荐20部播客节目。

 其中(2)(4) 在听众少的时候,比较难采纳,可以先从(1)(3) 开始做。

实现

收集播客和节目数据集

数据集来源:

Building a Podcast Recommendation Engine | Kaggle

将数据集存入mongoDB 数据库

代码

生成矢量数据库

根据播客和节目的描述生成矢量数据库。以便进一步进行相似性搜索(Similarity Search)。

生成用户数据集

通过程序生成一个·user 数据表。收听历史通过节目相似性查询生成。

代码

结果

http://www.dtcms.com/wzjs/232061.html

相关文章:

  • 陕西建设执业中心网站百度公司招聘官网
  • led营销型网站建设百度付费问答平台
  • 有模版之后怎么做网站百度关键词推广可以自己做吗
  • 自己做的网站某个网页打开很慢建站系统有哪些
  • 建设银行手机查询网站如何使用免费b站推广网站
  • 宜州市住房保障和城乡建设局网站短视频seo优化
  • dnf做任务解除制裁网站seo中文意思是
  • 厦门网页建设公司谷歌seo和百度seo
  • 网站编辑工具品牌策划方案
  • 网站开发包括网站过程百度推广电话客服24小时
  • 香港网站大陆速度百度官网优化
  • 网站建设怎样宣传比较好在广州做seo找哪家公司
  • 免费开商城网站吗产品网络推广的方法
  • 组建网站 多少钱优化建站
  • 北京贸易公司网站制作飓风seo刷排名软件
  • 哪些网站做微课赚钱小网站关键词搜什么
  • 上海学做网站seo推广教程视频
  • 广安网站建设免费b站推广网站有哪些
  • 更换网站后台免费推广链接
  • 深圳网站建设 卓营销推广外包
  • wordpress登录用户错乱北京中文seo
  • 邯郸网站开发公司如何做seo搜索引擎优化
  • 建设展示型网站公司哪家好seo是什么意思如何实现
  • 给朋友做网站警察开找技能培训有哪些
  • python做网站赚钱seo招聘要求
  • 企业网站功能网站宣传
  • 做电商怎么建网站怎么在百度上推广自己的店铺
  • 网站建设中心怎么做太原网络营销公司
  • 网站适配移动端和PC端十大网络舆情案例
  • js建设网站外网百度推广客服中心