python timedelta Python timedelta是时间机器?别笑!它能让你一天多出24小时 在数据科学这个特定领域, 存在着数量众多的工具以及各类库, 借助这些能让我们从数据当中提取出知识来。可是, 在像NumPy等之类常用库的表层之下, 潜藏着一个少有人知晓、然而功能却极为强大的库的集合体, 这些库能够给您的机器学习工作流程带来相当突出的助力。有哪些常见的机器学习库一些机器学习项目主要在于由NumPy以及-Learn等库来提供支持, NumPy有强大的数组掌控技能, 对于数值方面的计算而言是不能缺少的。借助其结构对数据处理以及分析起到了简化作用。去打造吸引人的数据可视化呈现, 和乃是没法缺少的资源。 -Learn在各种不同的机器学习任务当中比如聚类、回归以及分类等过程提供一系列全方位的工具包。当一起运用这些资源时, 数据科学家能够非常有成效地去审查、评估以及对数据予以建模。低调机器学习库 熊猫分析熊猫分析模块, 是能自动开展探索性数据分析EDA的强有力工具, 它会产出一份涵盖数据集诸多有价值信息的宽泛报告, 这些信息包含了该保留哪些变量, 以及该舍弃哪些变量。from pandas_profiling import ProfileReport profile ProfileReport(df, titleDataset Report, explorativeTrue) profile.to_notebook_iframe()使用之际, 此库给出了针对正被处理的数据的若干关键见解。当中部分涵盖:本部分对数据集所作出的介绍, 涵盖、涉及由有关变量以及观测值所构成的数量, 还包含了存在着的不同种类的变量。关于相关性, 在本节当中, 是运用热图来对数据集中变量之间的关系予以说明的。它具备一种能力, 即能够在各类有关的图之间完成切换操作。这些相关的图包含了皮尔逊的r、肯德尔的τ、斯皮尔曼的ρ以及Phikφk。警示, 此节含有针对具有大量零值、NaN值, 以及高度基数的分类变量的变量的注意事项。缺失这个工具, 是用于可视化数据集中缺失数据的, 它非常惊人, 属于包。它能够提供许多功能, 可以帮助分析师以及数据科学家去理解其数据里缺失值的分布情况还有存在状况。它还能提供一些可视化效果, 这些效果十分惊人, 比如:矩阵图, 它是那么一种东西, 那种能把数据集中 NULL、NAN 以及缺失值其所具备的整个存在状况, 以视觉图片的形式呈现给大家看的东西, 就是这样。pip install missingno import missingno as msno msno.matrix(df)创建条形图, 此条形图会针对每个要素列的值计数来做, 且不把每个要素列里的缺失值算在内。msno.bar(df, colordodgerblue, sortascending, figsize(8,6), fontsize8)热图, 它能够被用来搞出关联热图哦, 该关联热图目的在于鉴别以及剖析列之间存在的相关性咧。msno.heatmap(df)登上多图, 这给出了不同特征相互关联后, 存在缺失信息状况下的分层呈现。msno.dendrogram(df)皮卡雷特适用于的开源低代码, 有机器学习模块, 该模块尝试自动执行, 评估和对比回归, 还有和分类的机器学习算法所涉及的关键过程。它旨在缩短从假设到见解所需的时间, 所以经验丰富的数据科学家和新手都可以从中受益。众多机器学习项目阶段, 涵盖特征工程, 模型训练, 评估以及数据预处理, 皆是由自动化来达成的。除此之外, 它还具备比较多个机器学习模型以及微调超参数的功能。您可以使用 pip 安装 pip install pycaret要使用 进行分类您可以通过以下方式执行此操作from pycaret.classification import * clf setup(data, targettarget_column) best compare_models()PDd.HoUniAoHaO.CoM/stro/2505.html要使用 进行回归您可以通过以下方式执行此操作from pycaret.regression import * clf setup(data, targettarget_column) best compare_models()钟摆钟摆包, 是在中管理日期和时间的一个特别有用的工具。处理日期和时间之际, 它给出比内在的日期时间模块更可靠、对开发人员友善的API 用来做完日期和时间的格式化、解析以及算术运算等活动。它是管理应用程序里和时间有关的数据的生效工具, 因为它还给出时区以及持续时间计算等功能。该库的一些关键功能包括以实例来说, 运用 now函数去获取当下日期以及时间, 或者借助 函数来获取特定的日期还有时间, 如此一来您能够构建对象。而使用 local函数的话, 您同样能够构建出带有特定时区的实例。import pendulum dt pendulum.datetime(2020, 11, 27) print(dt) local pendulum.local(2020, 11,27) print(local) print(local.timezone.name)时区进行转换时, 库当中的, 这个以及那个函数, 能让在好多不同的时区范围之内实现切换这件事, 变得特别容易。utc_time pendulum.now(UTC) kolkata_time utc_time.in_timezone(Asia/Kolkata) print(Current Date Time in Kolkata , kolkata_time) sydney_tz pendulum.timezone(Australia/Sydney) sydney_time sydney_tz.convert(utc_time) print(Current Date Time in Sydney , sydney_time)针对日期时间的操作 , 能够运用add以及这两个函数去对日期和时间予以调整。每一个方法都会造就出一个全新的实例。dt pendulum.parse(1997-11-21T22:00:00, tz Asia/Calcutta) print(dt) dt pendulum.from_format(2020/11/21, YYYY/MM/DD) print(dt)用于计算持续时间以及周期有关的运算 — 库当中的 这个函数, 它能够让您去生成一种, 是针对可在 实例里进行添加操作或者是减去操作的持续时间之物。 此函数另外还具备这样的用途, 那就是可被用来去确定两个 实例相互之间的存在着的时间间隔。time_delta pendulum.duration(days 2, hours 10, years 2) print(time_delta) print(future date , pendulum.now() time_delta) start pendulum.datetime(2021, 1, 1) end pendulum.datetime(2021, 1, 31) period pendulum.period(start, end) print(period.days)结论总之, 为机器学习所准备的隐藏库, 给出了具备价值的工具, 能够推动您的项目, 从高效的时间管理一直到增强的数据可视化, 这些资源拓展了您的能力, 探究这些隐藏的瑰宝可提升工作效率以及工作的准确性, 随着其发展, 试验鲜为人知的库是保持优势的明智选择, 如果您尝试过上述任一库, 请告知我, 我极想倾听您最喜爱的低调ML库, 要是它们不在这篇文章里, 那就更多了, 在评论中让我知晓