Py之h5py:Python库之h5py库的简介、安装、使用方法详细攻略

Py之h5py:Python库之h5py库的简介、安装、使用方法详细攻略html

 

 

 

目录python

h5py的简介git

Websitesgithub

Installationweb

Reporting bugs数组

h5py的安装app

h5py的使用方法ide

一、写入数据学习

二、读取数据大数据


 

 

 

 

h5py的简介

      使用h5py库读写超过内存的大数据 。在简单数据的读操做中,咱们一般一次性把数据所有读入到内存中。读写超过内存的大数据时,有别于简单数据的读写操做,受限于内存大小,一般须要指定位置、指定区域读写操做,避免无关数据的读写。  h5py库恰好能够实现这一功能。
      h5py的优点:速度快、压缩效率高,总之,numpy.savez和cPickle存储work或不work的均可以试一试h5py!h5py文件是存放两类对象的容器,数据集(dataset)和组(group),dataset相似数组类的数据集合,和numpy的数组差很少。group是像文件夹同样的容器,它比如python中的字典,有键(key)和值(value)。group中能够存放dataset或者其余的group。”键”就是组成员的名称,”值”就是组成员对象自己(组或者数据集),下面来看下如何建立组和数据集。

相关文章HDF5 for Python

 

      h5py is a thin, pythonic wrapper around the HDF5, which runs on Python 3 (3.6+).

Websites

Installation

Pre-build h5py can either be installed via your Python Distribution (e.g. Continuum AnacondaEnthought Canopy) or from PyPI via pip. h5py is also distributed in many Linux Distributions (e.g. Ubuntu, Fedora), and in the MacOS package managers HomebrewMacports, or Fink.

More detailed installation instructions, including how to install h5py with MPI support, can be found at: https://docs.h5py.org/en/latest/build.html.

Reporting bugs

Open a bug at https://github.com/h5py/h5py/issues. For general questions, ask on the list (https://groups.google.com/d/forum/h5py).

 

 

h5py的安装

pip install h5py

安装成功!哈哈,继续学习去啦!

 

h5py的使用方法

后期更新……

一、写入数据

import h5py

"""
    create_dataset : 新建 dataset
    create_group : 新建 group
"""

x = np.arange(100)

with h5py.File('test.h5','w') as f:
    f.create_dataset('test_numpy',data=x)
    subgroup = f.create_group('subgroup')
    subgroup.create_dataset('test_numpy',data=x)
    subsub = subgroup.create_group('subsub')
    subsub.create_dataset('test_numpy',data=x)

 

二、读取数据

"""
    keys() : 获取本文件夹下全部的文件及文件夹的名字
    f['key_name'] : 获取对应的对象    
"""
def read_data(filename):
    with h5py.File(filename,'r') as f:

        def print_name(name):
            print(name)
        f.visit(print_name)
        print('---------------------------------------')
        subgroup = f['subgroup']  
        print(subgroup.keys())
        print('---------------------------------------')
        dset = f['test_numpy']
        print(dset)
        print(dset.name)
        print(dset.shape)
        print(dset.dtype)
        print(dset[:])
        print('---------------------------------------')

read_data('test.h5')

 

 

参考文章
h5py 必知--String存储

相关文章
相关标签/搜索