<div dir="ltr"><div dir="ltr"><p>Hello ESIP Cloud Computing Cluster Members!  We are excited to welcome speaker Lucas Sterzinger, a PhD candidate at UC Davis, to present on [kerchunk](<a href="https://fsspec.github.io/kerchunk/">https://fsspec.github.io/kerchunk/</a>) at this month's meeting.  Find the abstract and meeting agenda below.  <br>
**Meeting Logistics!**  <br>
Topic: Kerchunck tutorial  <br>
Speaker: Lucas Sterzinger  <br>
Monday April 25th, 10:00-11:00 am PT / 1:00-2:00 pm ET  <br>
<a href="https://us02web.zoom.us/j/86535177705?pwd=ay9yVDJ6UzNiSGRMWTFxbkNXdEJXUT09">https://us02web.zoom.us/j/86535177705?pwd=ay9yVDJ6UzNiSGRMWTFxbkNXdEJXUT09</a>  <br>
Meeting ID: 865 3517 7705  <br>
Passcode: 354962  <br>
Find your local number: [Zoom International Dial-in Numbers](<a href="https://us02web.zoom.us/u/knxOPNBj5">https://us02web.zoom.us/u/knxOPNBj5</a>)  <br>
**Abstract:**  <br>
Many organizations are moving their data to cloud-hosted object storage, which allows them greater flexibility in cost, dataset size, access, and security. For multi-dimensional data, the Zarr format has emerged as a popular cloud storage format, with consolidated metadata and data chunks stored in separate objects that allow efficient parallel access. NetCDF4/HDF5 files have been a community standard for decades and remain an extremely popular format, however, they do not have consolidated metadata. Without consolidated metadata, accessing this data requires many small reads resulting in poor performance on the cloud. Transforming the vast existing NetCDF4/HDF5 data archives would require substantial computational resources and create a duplicate of the dataset, doubling storage requirements and complicating data version control, provenance, and archive protocols. A potential solution to this problem is to create a consolidated metadata file containing the byte-range locations of the data chunks and use it to access the NetCDF4/HDF5 data.  Kerchunk, along with ReferenceFileSystem - a new part of the Intake group's fsspec (local and remote file system interfaces for Python) project - perform this task by creating a JSON file that allows a NetCDF4/HDF5 file to look like a file system. The data can then be read efficiently using the Zarr library directly. Using data from the GOES-East satellite hosted on Amazon Web Services, we demonstrate the effectiveness of this approach and provide a pathway to improving data access for the vast existing NetCDF4/HDF5 data archives.  <br>
**Prior to the meeting, please clone the repo and set up the environment as outlined in the readme at [<a href="https://github.com/lsterzinger/2022-esip-kerchunk-tutorial](">https://github.com/lsterzinger/2022-esip-kerchunk-tutorial](</a><a href="https://github.com/lsterzinger/2022-esip-kerchunk-tutorial)**">https://github.com/lsterzinger/2022-esip-kerchunk-tutorial)**</a>  <br>
**Agenda:**  <br>
* 5-10 minutes - Announcements: ESIP Summer meeting planning, Open Call for other announcements  <br>
  * Fill out the ESIP summer meeting interest poll at [<a href="https://forms.gle/iGjBVEjx5nUxkBRY7](">https://forms.gle/iGjBVEjx5nUxkBRY7](</a><a href="https://forms.gle/iGjBVEjx5nUxkBRY7">https://forms.gle/iGjBVEjx5nUxkBRY7</a>)  <br>
* 20-40 minutes - Hands on Presentation  <br>
* 10-20 minutes - Discussion and questions  <br>
Hope to see you next week!<br>
Jim</p></div></div>