Rrecipesrecipe创建预处理数据的配方

配方是对应用于数据集以便为数据分析做好准备的步骤的说明。

recipe(x,...)#S3methodfordefaultrecipe(x,...)#S3methodfordata.framerecipe(x,formula=NULL,...,vars=NULL,roles=NULL)#S3methodforformularecipe(formula,data,...)#S3methodformatrixrecipe(x,...)参数x,data模板数据集的DataFrame或小标题(见下文)。

传递给其他方法或从其他方法传递的更多参数(当前未使用)。

模型公式。这里不应使用in-line函数(例如log(x)、x:y等),并且不允许使用减号。这些类型的转换应使用此包中的step函数来执行。允许使用点,就像简单的多元结果项一样(即不需要cbind;请参阅示例)。由于内存问题,模型公式可能不是具有多列的高维数据的最佳选择。

与将在任何上下文中使用的变量相对应的列名称的字符串(见下文)

说明变量将扮演的单个角色的字符串(与vars相同的长度)。该值可以是任何值,但常见角色是"outcome"、"predictor"、"case_weight"或"ID"

类recipe和sub-objects的对象:

包含原始数据集列信息的tibble

包含数据集中当前术语集的小标题。这最初默认为var_info中包含的相同数据。

step或check对象的列表,定义将应用于数据的预处理操作的序列。默认值为NULL

数据的一小部分。它被初始化为与data参数中给出的数据相同,但在配方训练后可能会有所不同。

配方中的变量可以具有任何类型的作用,包括结果、预测变量、观察ID、案例权重、分层变量等。

recipe对象可以通过多种方式创建。如果分析仅包含结果和预测变量,则创建分析的最简单方法是使用不包含内联函数(例如log(x3))的公式(例如y~x1+x2)(请参见下面的第一个示例)。

或者,可以通过首先指定应使用数据集中的哪些变量,然后按顺序定义它们的角色来创建recipe对象(请参阅最后一个示例)。当变量数量非常多时,这种替代方法是一个很好的选择,因为公式方法是memory-inefficient,有很多变量。

有两种不同类型的操作可以按顺序添加到配方中。

配方最常见的两个应用是建模和stand-alone预处理。如何估计配方取决于它的使用方式。

使用配方进行建模的最佳方法是通过workflows包。这将模型和预处理器(例如菜谱)捆绑在一起,并为用户提供了一种流畅的方式来训练模型/菜谱并进行预测。

library(dplyr)library(workflows)library(recipes)library(parsnip)data(biomass,package="modeldata")#splitdatabiomass_tr<-biomass%>%filter(dataset=="Training")biomass_te<-biomass%>%filter(dataset=="Testing")#Withonlypredictorsandoutcomes,useaformula:rec<-recipe(HHV~carbon+hydrogen+oxygen+nitrogen+sulfur,data=biomass_tr)#Nowaddpreprocessingstepstotherecipe:sp_signed<-rec%>%step_normalize(all_numeric_predictors())%>%step_spatialsign(all_numeric_predictors())sp_signed####--Recipe------------------------------------------------------------####--Inputs##Numberofvariablesbyrole##outcome:1##predictor:5####--Operations##*Centeringandscalingfor:all_numeric_predictors()##*Spatialsignon:all_numeric_predictors()我们可以创建一个parsnip模型,然后使用该模型和配方构建工作流程:

predict(linear_sp_sign_fit,new_data=head(biomass_te))###Atibble:6x1##.pred####118.1##217.9##317.2##418.8##519.6##614.6Stand-alone食谱的使用当使用配方生成数据以进行可视化或解决配方的任何问题时,可以使用一些函数来估计配方并将其手动应用到新数据。

作为使用PCA的示例(可能是为了生成绘图):

#Definetherecipepca_rec<-rec%>%step_normalize(all_numeric_predictors())%>%step_pca(all_numeric_predictors())现在估计归一化统计数据和PCA负载:

pca_rec<-prep(pca_rec,training=biomass_tr)pca_rec####--Recipe------------------------------------------------------------####--Inputs##Numberofvariablesbyrole##outcome:1##predictor:5####--Traininginformation##Trainingdatacontained456datapointsandnoincompleterows.####--Operations##*Centeringandscalingfor:carbon,hydrogen,oxygen,...|Trained##*PCAextractionwith:carbon,hydrogen,oxygen,...|Trained请注意,估计的配方显示了选择器捕获的实际列名称。

bake(pca_rec,head(biomass_te))###Atibble:6x6##HHVPC1PC2PC3PC4PC5####118.30.730-0.412-0.4950.3330.253##217.60.6171.410.118-0.4660.815##317.20.7611.10-0.0550-0.3970.747##418.90.04000.9500.1580.405-0.143##520.50.792-0.7320.2040.465-0.148##618.50.433-0.127-0.354-0.0168-0.0888一般来说,对于大多数应用程序,建议使用配方的工作流程接口。

THE END
1.python毕设食品营养搭配系统49by3.程序+论文本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。 系统程序文件列表 开题报告内容 研究背景 随着生活水平的提高和健康意识的增强,人们对饮食的需求已经从单纯的饱腹转变为追求营养均衡和合理搭配。然而,在实际生活中,很多人对食品的营养成分和搭配原则了解不足,导致饮食https://blog.csdn.net/sheji714/article/details/144074605
2.食谱大全app哪个好?食谱大全app排行榜食谱大全app下载食谱大全app今天小编给大家带来了一些帮助大家做菜的小能,想做什么菜都可以在这些app中找寻找,涵盖了各样的菜谱,无论是煎炸烹炒样样都有。有的注重减肥,所以对于运动人来说可以选择减肥的食谱大全。还有的专门为儿童设置的健康菜谱大全app,以及有的app针对不同人群而设计,你可以根据自身来找寻合适自己的食谱大全。http://www.downcc.com/k/shipudaquanapp/
3.基于饮食知识图谱的食谱推荐系统的设计与实现为了满足人们在食谱个性化推荐方面的需求、解决当前食谱个性化推荐系统匮乏的问题,并充分利用知识图谱在改善个性化推荐方面的优势,本文对基于知识图谱的食谱个性化推荐展开了研究。主要工作如下:(1)利用从美食杰网站爬取的用户收藏的食谱数据、用户发布的食谱数据、用户制作的食谱数据,构建了用户-食谱偏好数据集。对饮食知识https://cdmd.cnki.com.cn/Article/CDMD-10286-1020801461.htm
4.计算机毕业设计之PyTroch+Spark+LSTM美食推荐系统食谱推荐系统数据库:mysql 数据分析:Spark 机器学习:PyTroch(基于神经网络的混合CF推荐算法)、协同过滤算法(基于用户、基于物品全部实现)、lstm评论情感分析 第三方平台:支付宝沙箱支付、百度AI图片识别、短信接口 数据集:Scrapy爬虫框架(Python) 创新点 Spark大屏、爬虫、协同过滤推荐算法、PyTroch神经网络推荐算法、AI识别、短信、支https://www.jianshu.com/p/9bce5d0a6809
5.域数据集组入门(控制台)在本练习中,您将使用 Amazon Personalize 控制台创建域数据集组和推荐器,以便为给定用户返回电影推荐。 在开始本练习之前,请查看入门先决条件。 完成入门练习后,为避免产生不必要的费用,请删除您创建的资源。有关更多信息,请参阅删除 Amazon Personalize 资源的要求。 https://docs.aws.amazon.com/zh_cn/personalize/latest/dg/getting-started-console-domain.html
6.今日食谱明日方舟WIKIBWIKI试验数据集 调律追忆 乐之节符 怒之节符 哀之节符 惧之节符 驮兽盲盒 辣瓶树水 繁荣点数 天桩(材料) 艺术馆集章卡 粗制糖块 急性感染抑制剂 参赛纪念 “应急物资”蓝图芯片 炉渣 魂灵书签 流光之沙 “探索者”兑换点数 今日食谱 胜绩积分 “我反对!” 匿名邀请函 卫戍认证 黑曜石节抽奖代币 汐斯塔的黑https://wiki.biligame.com/arknights/%E4%BB%8A%E6%97%A5%E9%A3%9F%E8%B0%B1
7.今日食谱PRTS试验数据集 调律追忆 驮兽盲盒 辣瓶树水 天桩 繁荣点数 艺术馆集章卡 粗制糖块 急性感染抑制剂 参赛纪念 “应急物资”蓝图芯片 炉渣 魂灵书签 散佚迷思 流光之沙 “探索者”兑换点数 今日食谱 胜绩积分 “我反对!” 匿名邀请函 卫戍认证 赏金猎人金币 黑曜石节手环 黑曜石节门票 汐斯塔的黑曜石 黑曜石节抽https://prts.wiki/w/%E4%BB%8A%E6%97%A5%E9%A3%9F%E8%B0%B1
8.尼格罗尼鸡尾酒苦味,杜松子酒,苦味,冰栏食谱酒精饮料库存图片尼格罗尼鸡尾酒 苦酒,杜松子酒,味酒吧 照片 关于 投反对票, 校正, 生气勃勃, 液体, 黑暗, 塑造, 玻璃, 新鲜, 打赌的人, 背包, 困难, 饮料, 柑橘, 欢乐, 多维数据集, 马蒂尼鸡尾酒, 汁液, 冷静, 橙色, 杜松子酒, 时数, 烤肉, 豪华, 鸡尾酒, 对象, https://cn.dreamstime.com/%E5%B0%BC%E6%A0%BC%E7%BD%97%E5%B0%BC%E9%B8%A1%E5%B0%BE%E9%85%92-%E8%8B%A6%E5%91%B3%EF%BC%8C%E6%9D%9C%E6%9D%BE%E5%AD%90%E9%85%92%EF%BC%8C%E8%8B%A6%E5%91%B3%EF%BC%8C%E5%86%B0-%E6%A0%8F-%E9%A3%9F%E8%B0%B1-%E9%85%92%E7%B2%BE%E9%A5%AE%E6%96%99-%E8%8B%A6%E9%85%92%EF%BC%8C%E6%9D%9C%E6%9D%BE%E5%AD%90%E9%85%92%EF%BC%8C%E5%91%B3%E9%85%92%E5%90%A7-image173917357
9.基于多模态信息抽取的菜品知识图谱构建具体来说,Recipe 1M提供了一套全面的食谱细节(包括配料、标题和说明),它丰富了图像和食谱之间的上下文关系,从而促进了跨模态检索。相比之下,CMIngre数据集仅局限于食材信息,这对有效的跨模态检索提出了更大的挑战。值得注意的是,我们的两阶段方法明显优于这些对比方法,这进一步凸显了两阶段方法的优势,即训练食材https://blog.51cto.com/u_15197658/10939232
10.使用AmazonPersonalize的代码示例AmazonSDKsAutoML 和传统食谱 HRNN HRNN 元数据 HRNN-Coldstart 准备训练数据 物品交互数据 项目元数据 用户元数据 操作元数据 操作交互数据 创建架构JSON文件 VIDEO_ON_ DEMAND 数据集和架构 物品交互数据集要求 用户数据集要求 物品数据集要求 ECOMMERCE数据集和架构 物品交互数据集要求 用户数据集要求 物品数据集要求 自定https://docs.amazonaws.cn/personalize/latest/dg/service_code_examples_personalize.html
11.超全数据集高清版.pdf数据结构与算法超全数据集 高清版.pdf 9页VIP内容提供方:133***9720 大小:348.58 KB 字数:约5.54千字 发布时间:2021-01-29发布于山东 浏览人气:63 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)超全数据集 高清版.pdf 关闭预览 想预览更多内容,点击免费在线预览https://max.book118.com/html/2021/0129/5140032324003120.shtm
12.Conservation中山大学范朋飞教授团队最新成果量化食谱为范朋飞教授团队基于此数据集,首次报道了海南长臂猿全年的量化食谱,并通过四个量化指标反映不同植物对于海南长臂猿的取食贡献,逐步筛选出海南长臂猿的重要食物名录(图2),为未来针对海南长臂猿的栖息地植被恢复提供树种选择参考。 图2 海南长臂猿的重要食物名录筛选流程https://cps.nwu.edu.cn/info/1069/1427.htm
13.中国哺乳动物形态,生活史和生态学特征数据集生活史和生态学特征数据集 (Crooks & Soulé, 1999); 妊娠期长,窝崽数少和世代 (Smith和解焱, 2009),《中国哺乳动物多样性及地理 周期长的物种一般很难从种群数量下降的状态恢 分布》(蒋志刚等, 2015),《中国兽类图鉴》(刘少英 复(Verde-Arregoitia, 2016); 栖息地和食谱窄的物种, 等, 2019, 2020)和《https://www.biodiversity-science.net/EN/article/downloadArticleFile.do?attachType=PDF&id=82199
14.在麻辣红汤豆腐多维数据集插画正版商用图片0zcbi2摄图新视界提供在麻辣红汤豆腐多维数据集图片下载,另有亚洲,正宗,豆,碗,可爱卡通动物,红辣椒,中国,中文,奶油,多维数据集,料理,烹饪,豆腐,美味佳肴,美味图片搜索供您浏览下载,每张图片均有版权可放心商用,您正在浏览的图片为0zcbi2https://xsj.699pic.com/tupian/0zcbi2.html
15.行业研究我们为以下语音数据集提供最新的培训食谱: 什么是新的: 2020年6月:发布了变压器配方。 2020年4月:现已支持 (使用 )和混合ASR的交叉熵训练。 和分别提供WSJ配方作为示例。 2020年3月:支持SpecAugment并发布了相关配方。 2019年9月:我们正在努力将Espresso与fairseq隔离开来,从而产生一个可以直接pip install的独立软件https://www.coder100.com/index/index/content/id/2337924
16.分析了600多种烘焙配方,机器学习开发出新品机器学习配方烘焙数据集整理 首先,Sara 和她的同事从网上搜集了 600 多个配方构成配方数据集,包括面包、蛋糕和饼干。然后,将其中常用的核心原料提取出来,共 16 种,包括面粉、酵母、牛奶、水、盐、蛋等。 然后对这些配方中,各种原料的度量单位进行统一,比如,有的以「杯」为单位,有的以「勺」为单位,作者将其全部转换为「盎司」https://www.cn-healthcare.com/articlewm/20210210/wap-content-1189180.html