TPU embeddings(利用TensorFlow构建推荐系统)
如果你正在构建大规模推荐系统,那么最大的挑战必定是模型当中的大型嵌入表,这些嵌入表是关键组件。但对他们的嵌入查询操作通常执行起来非常昂贵,这使他们成为性能的瓶颈。因此,接下来我们将讨论:”如何使用TPU embeddings
来应对这一挑战?“。
如果你正在构建大规模推荐系统,那么最大的挑战必定是模型当中的大型嵌入表,这些嵌入表是关键组件。但对他们的嵌入查询操作通常执行起来非常昂贵,这使他们成为性能的瓶颈。因此,接下来我们将讨论:”如何使用TPU embeddings
来应对这一挑战?“。
对象检测是在给定的图像中识别、分类和定位对象的过程。通常,你的输入是图像,标签是带有可选类标签的边界框。对象检测可以被认为是分类的扩展,但是您必须检测和定位任意数量的类,而不是图像的一个类标签。
TensorFlow Ranking
是一个开源库,用于开发可扩展的神经学习排名 (LTR
) 模型。 排名模型通常用于搜索和推荐系统,但也已成功应用于各种领域,包括机器翻译、对话系统、SAT
求解器、智能城市规划,甚至计算生物学。排名模型采用项目列表(网页、文档、产品、电影等)并以优化的顺序生成列表,例如最相关的项目位于顶部,最不相关的项目位于底部,通常应用于用户搜索:
在本例中,利用数据科学技能帮助识别Breakthrough Listen
目标扫描中的异常信号。由于没有已确认的外星信号,训练机器学习算法,因此在如大海捞针般的望远镜数据中加入了一些模拟信号(称之为“针”)。目前已经识别出一些隐藏的针,以便您可以训练模型找到更多隐藏的”针“。数据由二维数组组成,因此计算机视觉、数字信号处理、异常检测等方法可能很有优势。
您将获得每日历史销售数据。任务是预测测试集每个商店销售的产品总量。请注意,商店和产品列表每个月都会略有变化。创建一个可以处理此类情况的强大模型是挑战的一部分。
该数据集包含从UCF
犯罪数据集中的每个视频中提取的图像。,用于监控视频中的真实世界—异常检测。提取每10
帧长度的视频,并将其合并到该分类中。所有图片尺寸为64*64
,格式为.png
。该数据集共有14
个类别(1. Abuse 、2. Arrest、3. Arson、4. Assault、5. Burglary、6. Explosion、7. Fighting、8. Normal Videos、9. RoadAccidents、10. Robbery、11. Shooting、12. Shoplifting、13. Stealing、14. Vandalism
)。
该数据集包含35,685
个48x48
像素灰度图像的示例,分为训练数据集和测试数据集。根据面部表情中显示的情绪对图像进行分类(快乐、中性、悲伤、愤怒、惊讶、厌恶、恐惧)。
Mask R-CNN
方法可以有效地检测图片中的物体,同时为每个实例生成高质量的分割掩模。通过添加一个用于与现有的边界框识别分支并行预测对象掩模的分支来扩展Faster R-CNN
。Mask R-CNN
训练起来很简单,只给Faster R-CNN
增加了很小的开销,运行速度为5fps
。此外Mask R-CNN
很容易推广到其他任务。下面有一个实例:”检测显微镜图像中的单个神经元细胞“。