”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 我的 GSoC 经验:PEcAn 项目

我的 GSoC 经验:PEcAn 项目

发布于2024-08-31
浏览:258

My GSoC Experience : PEcAn Project

关于PEcAN:

预测生态系统分析器 (PEcAn) 是一个科学工作流程系统,用于管理大量公开可用的环境数据和贝叶斯数据同化系统,用于在最先进的生态系统模型中综合这些信息。

项目概要

组织:PecAn Project

导师:Christopher Black (#infotrop)、Shashank Singh(#moki1202)

贡献者:Abhinav Pandey (#Sweetdevil144)

项目持续时间: 350小时

项目标题: 优化 PEcAn 以独立使用单个

非常感谢克里斯,您仔细聆听我的方法并以更好的方式改进它们!!

也特别感谢其他导师:David LeBauer、Shashank Singh 和 Michael Dietze

关于该项目:

该项目的目标是通过优化其独立使用的模块来增强 PEcAn 项目。尽管 PEcAn 具有强大的框架和互连的模块,但越来越需要使这些模块独立运行。这种转变对于简化模块使用、测试和开发至关重要,使系统对用户和贡献者来说更容易访问和更高效。重点是优化独立使用的模块,增强它们在 PEcAn 互连框架内的单独可操作性。我们的首要任务是通过重新审视 PEcAn 封装的设计和界面来“重新松开这些耦合”。

概述

今年夏天,我有幸与 PEcAn 项目一起参加了 2024 年 Google 编程之夏。在今年计划中选出的众多才华横溢的候选人中,我是其中之一,被选为具有重大全球影响力的现实世界开源软件做出贡献。随着项目接近尾声,我想回顾一下过去三个月我在 PEcAn.

中学到的东西

我的 PEcAn 项目早在官方 GSoC 周期之前就开始了,我的第一个 PR 早在 2023 年 12 月就被合并了——比 GSoC 时间表提前了五个月。早期的参与为我提供了宝贵的经验,让我能够了解 PEcAn 错综复杂的架构和复杂的代码库设计。它还让我熟悉了该组织的工作,特别是 R 编程语言。从早期开始,我就渴望更深入地参与该项目并做出有意义的贡献。

GSoC 教给我的最有价值的一课是:我们通过实践学习,即使前方的道路似乎不确定,我们也为前进铺平道路。 我在这次 GSoC 之旅中的经历向我展示了什么我最初计划完成的只是我最终实现的一小部分。

通过 15 拉取请求、6 问题得到解决,以及在与导师的会议上花费了无数时间,我发现自己逐渐与 PEcAn 项目的目标保持一致.


我对 PEcAn 的贡献

(我将要讨论的所有工作都链接在此页面底部。)

GSoC 时期分为三个关键阶段:

  1. 第一阶段:社区联系期:在这个阶段,我熟悉了项目并与导师建立了牢固的联系。这一次让我对项目的目标和复杂性有了深入的了解。我首先对代码库进行了一些小的更改,同时掌握了 PEcAn 的关键方面。我的工作重点是收集数据,这些数据后来对于解决项目挑战至关重要。

  2. 阶段 2:解耦 PEcAn 的包:我在这个阶段的主要任务是开始解耦 PEcAn 的包,我的起点是 data.land 包。这涉及仔细检查项目中需要改进模块化和灵活性的包。在此阶段,我通过找出依赖项的微小实例并将其重定向回数据库调用,从 data.atmosphere 包中删除了 data.land 的依赖项,从而减少了总体依赖项。除此之外,我还对 为 met2Cf.csv.R 添加测试套件删除 db.site.lat.lon 函数并将所有用法替换为 query.site。我还组合了多个数据库调用,这进一步有助于减少我们系统中进行的数据库调用,并进一步减少数据库上的延迟。我还创建了一个自定义 python 脚本来查明代码库中不再使用的孤立函数,并执行此类实例的清理。

  3. 阶段3:增强convert_input函数:由于PEcAn中convert_input函数的复杂性,这一阶段被证明是最具挑战性的。我投入了大量时间来寻找解决我们所面临的各种问题的好方法。然而,由于此时我对代码库有了更深入的了解,这个阶段也是最有成效的。

在此阶段,我提出了一个新功能,可以通过 #3324 选择性地检索 site.info,从而增强灵活性。此外,我还帮助重构并删除了现已停产的 BrownDog 软件包,通过 #3348 确保了干净且现代的代码库。我成功删除了 BrownDog 的所有实例,同时与我的导师积极讨论这些更改。

为了进一步提高convert_input函数的模块化,我决定在#3338中将其分解为更小的辅助函数。这种重组简化了代码库的导航和理解,使未来的开发人员更容易使用。

在整个 GSoC 期间,我与我的导师定期举行会议(每周三),讨论我们每周的进展、未来计划和推进项目的策略。我的导师的定期帮助确实帮助我将注意力集中在该项目上。

我非常感谢整个 PEcAn 团队为我提供了这个难得的成长、学习和与他人合作的机会。真正让 GSoC 与众不同的是旅程本身的乐趣。我不仅熟练掌握了一门新的编程语言,而且我作为一个人也得到了成长,通过每周的会议和与导师的互动走出了我的舒适区。这段经历在技术上和个人上都具有变革性。

继续前进,我计划继续与 PEcAN 长期合作,并尽我所能提高 PEcAN 的能力!现在就这样了! ??

我在 PEcAn 项目中的 PRs 列表?

ID 标题 状态
3359 更新DEV-INTRO.md 合并
3312 在单个查询中组合多个 PEcAn.db 调用 合并
3308 删除 db.site.lat.lon 函数并将所有用法替换为 query.site 合并
3301 为met2Cf.csv.R添加测试套件 合并
3300 从 data.land 中删除对 data.atmosphere 的依赖 合并
3291 添加脚本以识别代码库中的孤立函数 合并
3290 删除未使用的 inst/met2CF.R 合并
3283 更新 API 端点 URL 合并
3281 修复met2model.SIPNET功能中的文件扩展名搜索 合并
3276 更新 cos_solar_zenith_angle 函数的文档 合并
3246 修复 Markdown 文档中的拼写错误和错误 合并
3243 更新book.yml 合并
3348 删除 Browndog 打开
3338 重构convert_input以通过辅助函数执行任务 打开
3324 添加功能可选择获取 site.info(如果不存在) 打开
3319 重构 met.process 和 dbfiles 打开
版本声明 本文转载于:https://dev.to/devrx/my-gsoc-experience-pecan-project-bi0?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 如何在 Go 中跟踪 HTTP POST 请求的进度?
    如何在 Go 中跟踪 HTTP POST 请求的进度?
    Go 中跟踪 HTTP POST 请求的进度通过 POST 请求发送大文件和图像时,开发者经常面临跟踪上传进度的挑战。本问题探讨了一种可靠的方法来监控 Go 应用程序中此类请求的进度。该问题建议手动打开 TCP 连接并分块发送 HTTP 请求。但是,此方法可能会遇到 HTTPS 站点的限制,并且不被...
    编程 发布于2024-11-06
  • 如何在 Java 中获取文件夹中的文件名列表?
    如何在 Java 中获取文件夹中的文件名列表?
    使用 Java 获取文件夹中的文件名获取目录中文件名列表的任务是各种环境中的常见需求编程场景。要在 Java 中实现此目的,有一种简单的方法,即利用 File 类。代码方法:首先,使用所需的目录路径实例化 File 对象:File folder = new File("your/path&...
    编程 发布于2024-11-06
  • 角管:综合指南
    角管:综合指南
    Angular 中的 Pipes 是简单的函数,用于在不修改底层数据的情况下转换模板中的数据。管道接收一个值,对其进行处理,然后返回格式化或转换后的输出。它们通常用于格式化日期、数字、字符串,甚至数组或对象。 它们允许您直接在视图中以更具可读性或相关性的格式格式化和显示数据,而无需更改底层数据模型。...
    编程 发布于2024-11-06
  • Tailwind CSS 和深色模式
    Tailwind CSS 和深色模式
    在本文中,我们将探讨如何在 Tailwind CSS 中实现深色模式。深色模式已成为流行的设计趋势,因为它可以在低光环境下提供更好的用户体验并减轻眼睛疲劳。 Tailwind 可以通过其内置实用程序轻松支持暗模式。 1. Tailwind 中的深色模式如何工作 Tailwind 提供...
    编程 发布于2024-11-06
  • 如何使用 CakePHP 的 Find 方法执行 JOIN 查询?
    如何使用 CakePHP 的 Find 方法执行 JOIN 查询?
    CakePHP Find 方法与 JOINCakePHP find 方法提供了一种从数据库检索数据的强大方法,包括连接表。本文演示了使用 CakePHP 的 find 方法执行 JOIN 查询的两种方法。方法 1:利用模型关系此方法涉及定义模型之间的关系并使用可遏制的行为。考虑以下模型关系:clas...
    编程 发布于2024-11-06
  • 如何在 Python 中重用生成器而不重新计算或存储结果?
    如何在 Python 中重用生成器而不重新计算或存储结果?
    通过重置在 Python 中重用生成器在 Python 中,生成器是用于迭代元素序列的强大工具。但是,一旦迭代开始,生成器就无法倒回。如果您需要多次重用生成器,这可能会带来挑战。重用生成器的一个策略是再次重新运行生成器函数。这将从头开始重新启动生成过程。然而,如果生成器函数的计算成本很高,则这种方法...
    编程 发布于2024-11-06
  • 面向 JavaScript 开发人员的热门 S 代码扩展
    面向 JavaScript 开发人员的热门 S 代码扩展
    JavaScript 正在快速发展,围绕它的工具生态系统也在快速发展。 作为开发人员,您希望使您的工作流程尽可能高效和流畅。这就是 Visual Studio Code (VS Code) 的用武之地。 我精心挑选了 5 个 VS Code 扩展,它们将显着增强您的 JavaScript 开发体验。...
    编程 发布于2024-11-06
  • 如何使用 HTML 输出标签来显示计算结果。
    如何使用 HTML 输出标签来显示计算结果。
    欢迎回来!我希望每个人都度过愉快的周末。今天,让我们回到 HTML 标签并重点关注 标签。 标签是什么? 标签用于显示计算结果。它是一个内联元素,可以放置在 、 或其他内联元素内。它通常用于显示计算结果或实时显示变量值。 阅读完整文章,实时观看并获取代码。 ...
    编程 发布于2024-11-06
  • Java:理解变量、数据类型和输入/输出
    Java:理解变量、数据类型和输入/输出
    介绍: Java 是世界上最流行、最通用的编程语言之一,它被用于从 Web 应用程序到移动应用程序的所有领域。如果您要开始 Java 之旅,了解基础知识至关重要。在本指南中,我们将深入探讨三个基本概念——变量、数据类型和输入/输出操作——它们构成了任何 Java 程序的支柱。在读完...
    编程 发布于2024-11-06
  • 如何根据 Div 的高度保持其纵横比?
    如何根据 Div 的高度保持其纵横比?
    根据高度维护 Div 的长宽比在网页设计中,控制元素的长宽比对于响应式布局至关重要。本题探讨了如何保持 div 的宽度占其高度的百分比,确保元素的形状保持一致,无论其高度如何变化。传统方法是使用 padding-top 来设置 div 的高度一个元素,而 padding-left 可以用作对象宽度的...
    编程 发布于2024-11-06
  • 在 Flet 中处理 DatePicker
    在 Flet 中处理 DatePicker
    我需要执行 DatePicker 的项目。 Veamos el ejemplo que proporciona la documentación oficial de Flet. import datetime import flet as ft def main(page: ft.Page): ...
    编程 发布于2024-11-06
  • 如何调整图像大小以适合圆形 SVG 蒙版?
    如何调整图像大小以适合圆形 SVG 蒙版?
    调整图像大小以适合圆形 SVG 路径尝试使用 SVG 路径从图像中剪切圆形部分时,这一点很重要以确保正确对齐。如果图像不太适合,可能是由于 SVG 蒙版的大小或位置不正确。这里有一种实现所需结果的替代方法:使用增强SVG 蒙版:此方法使用 SVG 蒙版创建一个圆孔,在其中显示图像:<svg w...
    编程 发布于2024-11-06
  • 技术面试问题 - 部分打字稿
    技术面试问题 - 部分打字稿
    Introduction Hello, hello!! :D Hope you’re all doing well! How we’re really feeling: I’m back with the second part of this series. ? In this...
    编程 发布于2024-11-06
  • 如何在 Laravel Eloquent 中为每个唯一的“seller_id”选择具有最大“created_at”的行?
    如何在 Laravel Eloquent 中为每个唯一的“seller_id”选择具有最大“created_at”的行?
    Laravel Eloquent: Select Rows with Maximum Created_at在 Laravel Eloquent 中,你可能会遇到需要选择所有具有最大值的行的场景表中每个唯一的 seller_id 的created_at 值。以下是实现此目的的方法:使用原始 SQL 查...
    编程 发布于2024-11-06
  • ReactJS 中的延迟加载:开发人员指南
    ReactJS 中的延迟加载:开发人员指南
    延迟加载是 ReactJS 中一项强大的技术,它允许组件或元素仅在需要时才加载,从而增强了 Web 应用程序的性能。在本文中,我们将探讨延迟加载的概念、它的好处,以及如何使用内置的 React.lazy() 和 React.Suspense 特征。   什么是延迟加载? 延迟加载是W...
    编程 发布于2024-11-06

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3