利用spark生成tfrecord文件

目前数据愈来愈多,数据通常存储在hdfs上,可是目前许多深度学习算法是基于TensorFlow、pytorch等框架实现,使用单机python、java作数据转换都比较慢,怎么大规模把hdfs数据直接喂到TensorFlow中,在这里TensorFlow提供了一种解决方案,利用spark生成tfrecord文件,项目名称叫spark-tensorflow-connector,GitHub主页在ht
相关文章
相关标签/搜索