当深度强化学习遇到『羊了个yang』；AI开始研究『麻将』了？3类资料带你准备技术面试；机器学习资源列表；前沿论文 | ShowMeAI资讯日报_mujoco menagerie-程序员宅基地

技术标签：面试 ShowMeAI资讯日报首席AI资讯收纳官机器学习深度学习人工智能职场和发展

日报合辑 | 电子月刊 | 公众号下载资料 | @韩信子

工具&框架

『DI-sheep』深度强化学习 + 了个

https://github.com/opendilab/DI-sheep

当 AI 技术的明珠——深度强化学习，遇到号称『通关率只有0.01%』的『了个』，会碰撞出哪些奇思妙想呢？

本项目构建了『了个』游*戏操作环境，使用深度强化学习，对『只有2关却永远过不了第2关』的它进行学习，项目使用的算法和覆盖的功能仍在不断优化中。

『Mjx』麻将 AI 研究框架

https://github.com/mjx-project/mjx

Mjx 是一个日本麻将（riichi Mahjong）模拟器。作为一个游戏服务器，Mjx 与流行的麻将模拟器 Mjai 一样，用于评估麻将 AI，但有额外的功能。它具备以下特性：

快速
与 Tenhou 完全兼容
类似 Gym 的 API
易于分布式计算
兼容 Mjai
优美的可视化

『Azimutt』实体关系图(ERD)可视化工具

https://github.com/azimuttapp/azimutt

https://azimutt.app/

Azimutt 是一个实体关系图（ERD）的可视化工具，有各种过滤器和输入，帮助你了解你的数据库模式。

『mp4grep』用于转录和搜索音频/视频的命令行工具

https://github.com/o-oconnell/mp4grep

mp4grep 是一个转录和搜索音频文件的工具，为快速重复搜索缓存结果。mp4grep 附带 mp4grep-convert，可以将 mp3、mp4、ogg、webm、mov、wav 和 avi 转换为正确的格式。

『Menagerie』MuJoCo 物理引擎高质量模型级

https://github.com/deepmind/mujoco_menagerie

Menagerie 是 MuJoCo 物理引擎的高质量模型集，由 DeepMind 开发。一个物理模拟器的好坏取决于它所模拟的模型，而在像 MuJoCo 这样具有许多建模选项的强大模拟器中，很容易创建出不符合预期行为的『坏』模型。

这个集合的目的是为社区提供一个精心设计的模型库，这些模型一开始就能很好地工作：Shadow E3M5、Robotiq 2F-85、Cassie、ANYmal B、ANYmal C、Unitree A1、Panda、UR5e

博文&分享

『Interview Resources』技术面试资源列表

https://github.com/nas5w/interview-resources

这是一个技术面试的资源汇集地！主要包含三部分内容：Leetcode-Style 面试、行为面试、一些很不错的补充资源。

Leetcode-Style 面试：面试中在白板或计算机上解决一些算法/数据结构问题。面试官以此判断变成能力、批判性思维、沟通&解决问题的能力。此类面试，面试候选人需要传达出自己的决策力与权衡力，并解释解决方案的时间和空间复杂性。

行为面试：工程师通常需要处理模棱两可的问题，甚至在压力下处理棘手问题。公司通过一些问题来判断面试候选人的情商与同理心。

『Neural Speech Synthesis』(Interspeech 2022 Tutorial)神经语音合成教程

https://github.com/tts-tutorial/interspeech2022

语音合成由『文本到语音(TTS)』和『语音转换(VC)』等几个关键任务组成，一直是语音界的热门研究课题，在业界具有广泛的应用。近年来，随着深度学习和人工智能的发展，基于神经网络的语音合成显着提高了合成语音的质量。

在本教程中，作者对神经语音合成进行了全面的介绍，包括四个部分：

语音合成技术的历史和神经语音合成的分类
文本转语音的关键方法和应用
语音转换的关键方法和应用
神经语音合成的挑战和未来的研究方向

数据&资源

『Planning with Deep Neural Networks』深度网络规划相关文献资源列表

https://github.com/ndrwmlnk/planning-with-deep-neural-networks-a-survey

『Awesome Machine Unlearning』机器学习相关资源大列表

https://github.com/tamlhp/awesome-machine-unlearning

清单包含以下主题：

A Framework of Machine Unlearning / 机器学习的框架
Surveys
Model-agnostic / 模型不可知
Model-intrinsic / 模型内在性
Data-Driven / 数据驱动
Datasets / 数据集
- Type: Image / 图像
- Type: Tabular / 表格式
- Type: Text / 文本
- Type: Sequence / 序列
- Type: Graph / 图形

研究&论文

可以点击这里回复关键字日报，获取整理好的论文合辑。

公众号后台回复关键字日报，获取整理好的论文合辑。

科研进展

2022.09.09 『闭环检测』 General Place Recognition Survey: Towards the Real-world Autonomy Age

2022.09.06 『语音识别』 ASR2K: Speech Recognition for Around 2000 Languages without Audio

2022.08.18 『3D形状建模』 LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling

论文：General Place Recognition Survey: Towards the Real-world Autonomy Age

论文时间：9 Sep 2022

领域任务：Loop Closure Detection, Simultaneous Localization and Mapping, 闭环检测，同时定位和建图(SLAM)

论文地址：https://arxiv.org/abs/2209.04497

代码实现：https://github.com/MetaSLAM/GPRS

论文作者：Peng Yin, Shiqi Zhao, Ivan Cisneros, Abulikemu Abuduweili, Guoquan Huang, Micheal Milford, Changliu Liu, Howie Choset, Sebastian Scherer

论文简介：A summary of this work and our datasets and evaluation API is publicly available to the robotics community at https://github.com/MetaSLAM/GPRS /这项工作的摘要以及我们的数据集和评估API已公开提供给机器人社区 https://github.com/MetaSLAM/GPRS

论文摘要：地点识别是能够协助同步定位和绘图（SLAM）的基本模块，用于长期导航的环形封闭检测和重新定位。在过去的20年里，地点识别界取得了惊人的进展，这引起了广泛的研究兴趣，并在计算机视觉和机器人学等多个领域得到应用。然而，在复杂的真实世界场景中，很少有方法显示出有希望的地点识别性能，因为长期和大规模的外观变化通常会导致失败。此外，在最先进的方法中缺乏一个综合的框架，可以处理场所识别中的所有挑战，包括外观变化、视角差异、对未知区域的鲁棒性以及在现实世界中的应用效率。在这项工作中，我们调查了针对长期定位的最先进的方法，并讨论了未来的方向和机会。我们首先调查了长期自主性中地点识别的表述以及现实世界环境中的主要挑战。然后，我们回顾了最近针对不同传感器模式的地点识别工作，以及当前处理各种地点识别挑战的策略。最后，我们回顾了现有的长期定位的数据集，并介绍了我们的数据集和针对不同方法的评估API。本文可以作为新加入地点识别社区的研究人员和那些关心长期机器人自主性的研究人员的教程。我们还提供了我们对机器人学中经常问到的问题的看法。机器人是否需要准确的定位来实现长期的自主性？这项工作的摘要以及我们的数据集和评估API已公开提供给机器人社区 https://github.com/MetaSLAM/GPRS

论文：ASR2K: Speech Recognition for Around 2000 Languages without Audio

论文时间：6 Sep 2022

领域任务：speech-recognition, Speech Recognition，语音识别

论文地址：https://arxiv.org/abs/2209.02842

代码实现：https://github.com/xinjli/asr2k

论文作者：Xinjian Li, Florian Metze, David R Mortensen, Alan W Black, Shinji Watanabe

论文简介：We achieve 50% CER and 74% WER on the Wilderness dataset with Crubadan statistics only and improve them to 45% CER and 69% WER when using 10000 raw text utterances./我们在Wilderness数据集上仅用Crubadan的统计数据就取得了50%的CER和74%的WER，在使用10000个原始文本语料时，将其提高到45%的CER和69%的WER。

论文摘要：最近的大多数语音识别模型都依赖于大型监督数据集，而这些数据集对于许多低资源的语言来说是不可用的。在这项工作中，我们提出了一个不需要目标语言的任何音频的语音识别管道。唯一的假设是，我们可以获得原始文本数据集或一组n-gram统计数据。我们的语音管道由三个部分组成：声学、发音和语言模型。与标准管道不同，我们的声学和发音模型使用多语言模型，没有任何监督。语言模型是使用n-gram统计或原始文本数据集建立的。我们通过与Crubadan：一个大型的濒危语言n-gram数据库相结合，为1909种语言建立语音识别。此外，我们在两个数据集的129种语言上测试我们的方法。通用语音和CMU荒野数据集。在Wilderness数据集上，我们仅用Crubadan的统计数据就取得了50%的CER和74%的WER，当使用10000个原始文本语料时，我们将其提高到45%的CER和69%的WER。

论文：LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling

论文时间：18 Aug 2022

领域任务：3D Shape Modeling，3D形状建模

论文地址：https://arxiv.org/abs/2208.08622

代码实现：https://github.com/BoyanJIANG/LoRD

论文作者：Boyan Jiang, Xinlin Ren, Mingsong Dou, xiangyang xue, Yanwei Fu, yinda zhang

论文简介：Recent progress in 4D implicit representation focuses on globally controlling the shape and motion with low dimensional latent vectors, which is prone to missing surface details and accumulating tracking error./4D隐含表示法的最新进展集中在用低维潜伏矢量全局控制形状和运动，这很容易遗漏表面细节并积累跟踪误差。

论文摘要：4D隐式表征的最新进展集中在用低维潜伏向量全局控制形状和运动，这容易遗漏表面细节和积累跟踪误差。虽然许多深度局部表征在三维形状建模中显示出了很好的效果，但其四维对应物还不存在。在本文中，我们通过提出一种新型的动态衣着人的局部4D隐含表征（LoRD）来填补这一空白，该表征具有4D人体建模和局部表征的优点，并能对详细的表面变形（如衣服皱纹）进行高保真重建。特别是，我们的关键见解是鼓励网络学习本地部件级表征的潜在代码，能够解释本地几何和时间变形。为了在测试时间进行推理，我们首先估计身体内部的骨架运动，以便在每个时间步长跟踪局部部位，然后根据不同类型的观察数据，通过自动解码优化每个部位的潜伏代码。大量的实验表明，所提出的方法具有很强的表现4D人类的能力，并在实际应用中优于最先进的方法，包括从稀疏点重建4D，非刚性深度融合，无论是定性还是定量。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！

◉ 点击 日报合辑，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。

◉ 点击 电子月刊，快速浏览月度合辑。

◉ 点击这里，回复关键字日报获取AI电子月刊与论文 / 电子书等资料包。

ShowMeAI 致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击专栏，查看历史消息。公众号（ShowMeAI研究中心）回复关键字日报，可以获取资源包（资料整理汇总与AI电子月刊）。

本文链接：https://blog.csdn.net/ShowMeAI/article/details/127051611

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

LeetCode String to Integer (atoi) c++_c++ atoi越界-程序员宅基地

文章浏览阅读561次。首先总结下做题的过程，最开始我又忘记了应该先明确思路再写代码的信条，写一点提交一次，改一次，效率极低，直到自己崩溃，推翻重做。问题分析（题目中有） String转int考虑空格问题考虑+，-号问题考虑整型越界问题解决办法考虑从前遍历还是从后遍历空格问题空格在数字前：跳过空格在数字中间：跳出+号问题：在数字前跳过即可，在数字中跳出-号问题：在数字前，记录，最后结果*-1，在_c++ atoi越界

Android 音乐APP（五）音乐通知栏、后台播放音乐，程序员必须要了解的知识点_android 音视频播放通知栏控制-程序员宅基地

文章浏览阅读780次，点赞13次，收藏25次。外链图片转存中…(img-W5XkH1g3-1712366644249)][外链图片转存中…(img-J2Cr3hvG-1712366644250)][外链图片转存中…(img-39HoYf8D-1712366644250)][外链图片转存中…(img-utHeNPyS-1712366644250)][外链图片转存中…(img-jRrbl8QM-1712366644251)]_android 音视频播放通知栏控制

android画布画弧形,在Android中绘制圆弧边缘圆弧,具有浮雕效果-程序员宅基地

文章浏览阅读419次。我正在尝试开发一个自定义组件，即圆弧滑块，我完成了弧和拇指，但不能弄清楚如何绘制圆弧边缘弧和其中的浮雕效果。在这一刻，滑块看起来像这样绘制弧的代码是private void drawSlider(Canvas canvas) {float sweepDegrees = (value * arcWidthInAngle)/ (maximumValue - minimumValue);// the g..._android使用弯曲边缘绘制圆弧

python 程序运行计时动态,在python中运行计时器几分钟-程序员宅基地

文章浏览阅读229次。我试图每秒运行一个函数“foo”。我要说几分钟。在函数foo()向服务器发出100个HTTP请求(其中包含一个JSON对象)，并打印JSON响应。在简而言之，我必须在5分钟内每秒发出100个HTTP请求。在我刚开始学习python，知识面不广。这就是我所尝试的：import threadingnoOfSecondsPassed = 0def foo():global noOfSecondsPass..._python 程序运行计时动态效果

linux离线安装llvm,Debian/Ubuntu Linux 下安装LLVM/Clang 编译器-程序员宅基地

文章浏览阅读670次。第一步，首先编辑 /etc/apt/sources.list,增加下面源：(加入源后务必执行apt-get update,假设有错误提示，先执行第二步，然后apt-get update)Debian平台：deb http://llvm.org/apt/wheezy/ llvm-toolchain-wheezy maindeb-src http://llvm.org/apt/wheezy/ llvm..._llvm离线升级

Java集合 —— Map集合-程序员宅基地

文章浏览阅读786次，点赞27次，收藏13次。具体实现我在之前的博客写过了集合List和Map——重写equals和hashCode方法（集合元素是类的对象）这里举一个简单的例子return age;@Override@Override自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。