Attentioncenter是一个机器学习模型,这个仓库包含:
一个TensorFlowLite模型,可用于预测图像的注意中心,即图像中最突出的部分所在的区域一个Python脚本,可用于使用注意力中心对图像进行批量编码。这可以和子模块libjxl一起使用,以便创建JPEGXL图像,这样解码图像将从由模型决定的注意中心开始。GoogleAttentioncenter模型的一些预测实例,其中绿点是模型预测的图像注意力中心点。
如何使用请确保你已经安装了Python和Tensorflow:
从GitHub上克隆它,包括子模块构建libjxl,按照libjxlrepo中给出的说明运行encode_with_centers.py脚本。gitclonehttps://github.com/google/attention-center--recursive--shallow-submodulescdattention-center/libjxlmkdirbuildcdbuildcmake-DCMAKE_BUILD_TYPE=Release-DBUILD_TESTING=OFF..cmake--build.---j$(nproc)cd../../pythonencode_with_centers.py--lite_model_file=./model/center.tflite\--image_dir="${INPUT_IMAGE_DIR}"--output_dir="${OUTPUT_IMAGE_DIR}"有以下标志:
--[no]dry_run:Iftrue,onlydoadryrun,donotwritefiles.(default:'false')--encoder:Locationofthencoderbinary.--image_dir:Nameofthedirectoryofinputimages.(default:'./libjxl/build/tools/cjxl')--lite_model_file:PathtothecorrespondingTFLitemodel.--new_suffix:Fileextensionofthecompressedfile.(default:'jxl')--output_dir:Nameofthedirectoryoftheoutputimages.--[no]verbose:Iftrue,printsinfoaboutthecommandsexecuted.(default:'true')
评论