.. _program_listing_file__tmp_ws_src_vitis_common_include_imgproc_xf_cvt_color.hpp: Program Listing for File xf_cvt_color.hpp ========================================= |exhale_lsh| :ref:`Return to documentation for file ` (``/tmp/ws/src/vitis_common/include/imgproc/xf_cvt_color.hpp``) .. |exhale_lsh| unicode:: U+021B0 .. UPWARDS ARROW WITH TIP LEFTWARDS .. code-block:: cpp /* * Copyright 2019 Xilinx, Inc. * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You may obtain a copy of the License at * * http://www.apache.org/licenses/LICENSE-2.0 * * Unless required by applicable law or agreed to in writing, software * distributed under the License is distributed on an "AS IS" BASIS, * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. * See the License for the specific language governing permissions and * limitations under the License. */ #ifndef _XF_CVT_COLOR_HPP_ #define _XF_CVT_COLOR_HPP_ #include "../common/xf_common.hpp" #include "hls_stream.h" #include "xf_cvt_color_1.hpp" #include "xf_cvt_color_utils.hpp" #include namespace xf { namespace cv { template void write_y_ro(xf::cv::Mat& src_y, xf::cv::Mat& out_y, uint16_t height, uint16_t width) { XF_SNAME(WORDWIDTH_SRC) tmp; unsigned long long int idx = 0; for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS #pragma HLS LOOP_FLATTEN off // clang-format on for (int j = 0; j < (width >> XF_BITSHIFT(NPC)); j++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on tmp = src_y.read(i * (width >> XF_BITSHIFT(NPC)) + j); out_y.write(idx++, tmp); } } } // KernRgba2Yuv4 template void KernRgba2Yuv4_ro(xf::cv::Mat& src, xf::cv::Mat& dst1, xf::cv::Mat& dst2, xf::cv::Mat& dst3, uint16_t height, uint16_t width) { // width=width>>NPC; XF_PTNAME(XF_8UP) Y0[16], U[16], V[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=U complete #pragma HLS ARRAY_PARTITION variable=V complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on unsigned long long int y_idx = 0, u_idx = 0, v_idx = 0; XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_DST) YPacked, UPacked, VPacked; uint8_t offset; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS PIPELINE #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = src.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); // Converting from RGBA to YUV4 // Y = (0.257 * R) + (0.504 * G) + (0.098 * B) + 16 // U = -(0.148 * R) - (0.291 * G) + (0.439 * B) + 128 // V = (0.439 * R) - (0.368 * G) - (0.071 * B) + 128 for (int l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC // clang-format on //#pragma HLS unroll if (PLANES == 4) { offset = l << 3; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); U[(l << 1)] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); U[(l << 1) + 1] = CalculateU(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); V[(l << 1)] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); V[(l << 1) + 1] = CalculateV(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); U[(l << 1)] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); U[(l << 1) + 1] = CalculateU(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); V[(l << 1)] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); V[(l << 1) + 1] = CalculateV(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); } } YPacked = PackPixels(Y0); UPacked = PackPixels(U); VPacked = PackPixels(V); dst1.write(y_idx++, YPacked); dst2.write(u_idx++, UPacked); dst3.write(v_idx++, VPacked); } } } // KernRgba2Iyuv template void KernRgba2Iyuv_ro(xf::cv::Mat& rgba, xf::cv::Mat& y_plane, xf::cv::Mat& u_plane, xf::cv::Mat& v_plane, uint16_t height, uint16_t width) { ap_uint8_t Y0[16], U[16], V[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=U complete #pragma HLS ARRAY_PARTITION variable=V complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on unsigned long long int y_idx = 0, out_idx = 0, out_idx1 = 0; XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_DST) YPacked, UPacked, VPacked; uint8_t Ycount = 0, UVcount = 0; int offset; uchar_t UVoffset_ind, l; ap_uint<13> i, j; UVoffset_ind = (1 << XF_BITSHIFT(NPC)) >> 1; bool evenRow = true, evenBlock = true; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = rgba.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); for (l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on if (PLANES == 4) { offset = l << 3; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); } if (evenRow) // As Sampling rate is 2, Calculating U and V components // only for even rows { /* 128 is added to U and V values to make them always positive and in * studio range 16-240 */ if (evenBlock) { U[l] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); V[l] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); } else { U[UVoffset_ind + l] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); V[UVoffset_ind + l] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); } } } YPacked = PackPixels(Y0); y_plane.write(y_idx++, YPacked); if (evenRow & !evenBlock) { UPacked = PackPixels(U); VPacked = PackPixels(V); u_plane.write(out_idx++, UPacked); v_plane.write(out_idx1++, VPacked); } evenBlock = evenBlock ? false : true; } evenRow = evenRow ? false : true; } // if(((ROWS+1)>>1) & 0x1) // { // Filling the empty region with zeros, when the height is // multiple // of 2 but not a multiple of 4 // for( i = 0; i < width; i++) // { //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // u_plane.write(0); // v_plane.write(0); // } // } } // KernRgba2Nv12 template void KernRgba2Nv12_ro(xf::cv::Mat& rgba, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { // width=width>>NPC; XF_PTNAME(XF_8UP) Y0[16], UV[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=UV complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long int idx = 0, idx1 = 0; uint8_t offset; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = rgba.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); for (int l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on if (PLANES == 4) { offset = l << 3; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); } if (evenRow) { UV[l << 1] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); UV[(l << 1) + 1] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); } } YPacked = PackPixels(Y0); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UV); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } // KernRgba2Nv12 template void Kernbgr2Nv12_ro(xf::cv::Mat& rgba, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { // width=width>>NPC; XF_PTNAME(XF_8UP) Y0[16], UV[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=UV complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long int idx = 0, idx1 = 0; uint8_t offset; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = rgba.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); for (int l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on if (PLANES == 4) { // offset = l << 3; // Y0[(l<<1)] = CalculateY(RGB[offset+0], // RGB[offset+1], RGB[offset+2]); // Y0[(l<<1)+1] = CalculateY(RGB[offset+4], // RGB[offset+5], RGB[offset+6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 5], RGB[offset + 4], RGB[offset + 3]); } if (evenRow) { UV[l << 1] = CalculateU(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); UV[(l << 1) + 1] = CalculateV(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); } } YPacked = PackPixels(Y0); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UV); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } // KernRgba2Nv21 template void KernRgba2Nv21_ro(xf::cv::Mat& rgba, xf::cv::Mat& y_plane, xf::cv::Mat& vu_plane, uint16_t height, uint16_t width) { // width=width>>NPC; uint16_t i, j, k, l; ap_uint8_t Y0[16], VU[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=VU complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_Y) YPacked, VUPacked; uint8_t offset; unsigned long long int idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = (XF_SNAME(WORDWIDTH_SRC))rgba.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); for (int l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on if (PLANES == 4) { offset = l << 3; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 4], RGB[offset + 5], RGB[offset + 6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 3], RGB[offset + 4], RGB[offset + 5]); } if (evenRow) { VU[(l << 1)] = CalculateV(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); VU[(l << 1) + 1] = CalculateU(RGB[offset + 0], RGB[offset + 1], RGB[offset + 2]); } } YPacked = PackPixels(Y0); y_plane.write(idx++, YPacked); if (evenRow) { VUPacked = PackPixels(VU); vu_plane.write(idx1++, VUPacked); } } evenRow = evenRow ? false : true; } } template void Kernbgr2Nv21_ro(xf::cv::Mat& rgba, xf::cv::Mat& y_plane, xf::cv::Mat& vu_plane, uint16_t height, uint16_t width) { // width=width>>NPC; uint16_t i, j, k, l; ap_uint8_t Y0[16], VU[16]; uint8_t RGB[64]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Y0 complete #pragma HLS ARRAY_PARTITION variable=VU complete #pragma HLS ARRAY_PARTITION variable=RGB complete // clang-format on XF_SNAME(WORDWIDTH_SRC) PackedPixels; XF_SNAME(WORDWIDTH_Y) YPacked, VUPacked; uint8_t offset; unsigned long long int idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on PackedPixels = (XF_SNAME(WORDWIDTH_SRC))rgba.read(i * width + j); ExtractRGBAPixels(PackedPixels, RGB); for (int l = 0; l<(1 << XF_BITSHIFT(NPC))>> 1; l++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on if (PLANES == 4) { // offset = l << 3; // Y0[(l<<1)] = CalculateY(RGB[offset+0], // RGB[offset+1], RGB[offset+2]); // Y0[(l<<1)+1] = CalculateY(RGB[offset+4], // RGB[offset+5], RGB[offset+6]); } else { offset = l * 6; Y0[(l << 1)] = CalculateY(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); Y0[(l << 1) + 1] = CalculateY(RGB[offset + 5], RGB[offset + 4], RGB[offset + 3]); } if (evenRow) { VU[(l << 1)] = CalculateV(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); VU[(l << 1) + 1] = CalculateU(RGB[offset + 2], RGB[offset + 1], RGB[offset + 0]); } } YPacked = PackPixels(Y0); y_plane.write(idx++, YPacked); if (evenRow) { VUPacked = PackPixels(VU); vu_plane.write(idx1++, VUPacked); } } evenRow = evenRow ? false : true; } } // KernIyuv2Rgba template void KernIyuv2Rgba_ro(xf::cv::Mat& in_y, xf::cv::Mat& in_u, xf::cv::Mat& in_v, xf::cv::Mat& _rgba, uint16_t height, uint16_t width) { // width=width>>NPC; // ap_uint<13> i,j,k; // uchar_t k; XF_PTNAME(XF_8UP) RGB[64], Ybuf[16], Ubuf[16], Vbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=Ubuf complete #pragma HLS ARRAY_PARTITION variable=Vbuf complete // clang-format on hls::stream UStream, VStream; // clang-format off #pragma HLS STREAM variable=&UStream depth=COLS #pragma HLS STREAM variable=&VStream depth=COLS // clang-format on XF_SNAME(WORDWIDTH_SRC) YPacked, UPacked, VPacked; XF_SNAME(WORDWIDTH_DST) PackedPixels; unsigned long long int idx = 0, out_idx = 0; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; uint8_t offset; bool evenRow = true, evenBlock = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YPacked = in_y.read(i * width + j); xfExtractPixels(Ybuf, YPacked, 0); if (evenBlock) { if (evenRow) { UPacked = in_u.read(idx); UStream.write(UPacked); VPacked = in_v.read(idx++); VStream.write(VPacked); } else { /* Copy of the U and V values are pushed into stream to be used for * next row */ UPacked = UStream.read(); VPacked = VStream.read(); } xfExtractPixels(Ubuf, UPacked, 0); xfExtractPixels(Vbuf, VPacked, 0); offset = 0; } else { offset = (1 << XF_BITSHIFT(NPC)) >> 1; } for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // Y00 and Y01 have a U and V values in common // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on // Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // Y01 = (Ybuf[(k<<1) + 1] > 16) ? (Ybuf[(k<<1)+1]-16) : 0; if ((Ybuf[k << 1] > 16)) { Y00 = (Ybuf[k << 1] - 16); } else { Y00 = 0; } if ((Ybuf[(k << 1) + 1] > 16)) { Y01 = (Ybuf[(k << 1) + 1] - 16); } else { Y01 = 0; } U = Ubuf[k + offset] - 128; V = Vbuf[k + offset] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + 0.596*V // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y - 0.813*V - 0.391*U // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + 0.018*U RGB[(k << 3)] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; // A RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B1 RGB[(k << 3) + 7] = 255; // A } PackedPixels = PackRGBAPixels(RGB); _rgba.write(out_idx++, PackedPixels); evenBlock = evenBlock ? false : true; } evenRow = evenRow ? false : true; } } // KernIyuv2Nv12 template void KernIyuv2Nv12_ro(xf::cv::Mat& _u, xf::cv::Mat& _v, xf::cv::Mat& _uv, uint16_t height, uint16_t width) { ap_uint<13> i, j; XF_PTNAME(XF_8UP) U[16], V[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=U complete #pragma HLS ARRAY_PARTITION variable=V complete // clang-format on unsigned long long int idx = 0, idx1 = 0; XF_SNAME(WORDWIDTH_SRC) UVPacked0, UVPacked1, UPacked, VPacked; rowloop: for (i = 0; i> 1; i++) { /* * Reading the plane interleaved U and V data from streams and packing them in * pixel interleaved * and writing out to UV stream */ // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=rTC max=rTC // clang-format on columnloop: for (j = 0; j < (width >> (1 + XF_BITSHIFT(NPC))); j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=cTC max=cTC // clang-format on UPacked = _u.read(idx); VPacked = _v.read(idx++); xfExtractPixels(U, UPacked, 0); xfExtractPixels(V, VPacked, 0); // Packing with alternative U and V values for Pixel interleaving #define AU_CVT_STEP 16 ap_uint<4> off = (1 << XF_BITSHIFT(NPC)) >> 1; ap_uint<4> k; int l; for (k = 0, l = 0; k < ((1 << XF_BITSHIFT(NPC)) >> 1); k++, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on UVPacked0.range(l + AU_CVT_STEP - 1, l) = (U[k]) | ((ap_uint<16>)V[k] << (8)); UVPacked1.range(l + AU_CVT_STEP - 1, l) = (U[k + off]) | ((ap_uint<16>)V[k + off] << (8)); } _uv.write(idx1++, UVPacked0); _uv.write(idx1++, UVPacked1); } } } // KernIyuv2Yuv4 template void KernIyuv2Yuv4_ro(xf::cv::Mat& _in_u, xf::cv::Mat& _in_v, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { XF_TNAME(SRC_T, NPC) arr[COLS >> XF_BITSHIFT(NPC)]; XF_TNAME(SRC_T, NPC) arr1[COLS >> XF_BITSHIFT(NPC)]; hls::stream inter_u, inter_v; // clang-format off #pragma HLS stream variable=&inter_u depth=COLS/2 #pragma HLS stream variable=&inter_v depth=COLS/2 // clang-format on unsigned long long int idx = 0, idx1 = 0; XF_PTNAME(XF_8UP) U[16], V[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=U complete #pragma HLS ARRAY_PARTITION variable=V complete // clang-format on XF_SNAME(WORDWIDTH) IUPacked, IVPacked, UPacked0, VPacked0, UPacked1, VPacked1; rowloop: for (int i = 0; i < ((height >> 2) << 1); i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=rTC max=rTC // clang-format on columnloop: for (int j = 0, k = 0; j < ((width >> XF_BITSHIFT(NPC)) >> 1); j++, k += 2) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=cTC max=cTC // clang-format on IUPacked = _in_u.read(idx); IVPacked = _in_v.read(idx++); xfExtractPixels(U, IUPacked, 0); xfExtractPixels(V, IVPacked, 0); #define AU_CVT_STEP 16 int off = 1 << (2); // (1 << NPC) >> 1; for (int k = 0, l = 0; k < (1 << (2)); k++, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on UPacked0.range(l + AU_CVT_STEP - 1, l) = (U[k]) | ((ap_uint<16>)U[k] << (8)); VPacked0.range(l + AU_CVT_STEP - 1, l) = (V[k]) | ((ap_uint<16>)V[k] << (8)); UPacked1.range(l + AU_CVT_STEP - 1, l) = (U[k + off]) | ((ap_uint<16>)U[k + off] << (8)); VPacked1.range(l + AU_CVT_STEP - 1, l) = (V[k + off]) | ((ap_uint<16>)V[k + off] << (8)); } _u_image.write((((i * 2)) * (_u_image.cols >> XF_BITSHIFT(NPC))) + k, UPacked0); _v_image.write((((i * 2)) * (_v_image.cols >> XF_BITSHIFT(NPC))) + k, VPacked0); _u_image.write((((i * 2)) * (_u_image.cols >> XF_BITSHIFT(NPC))) + k + 1, UPacked1); _v_image.write((((i * 2)) * (_v_image.cols >> XF_BITSHIFT(NPC))) + k + 1, VPacked1); inter_u.write(UPacked0); inter_v.write(VPacked0); inter_u.write(UPacked1); inter_v.write(VPacked1); } for (int j = 0; j < (_u_image.cols >> XF_BITSHIFT(NPC)); j++) { // clang-format off #pragma HLS pipeline // clang-format on _u_image.write((((i * 2) + 1) * (_u_image.cols >> XF_BITSHIFT(NPC))) + j, inter_u.read()); _v_image.write((((i * 2) + 1) * (_u_image.cols >> XF_BITSHIFT(NPC))) + j, inter_v.read()); } } } // KernNv122Iyuv template void KernNv122Iyuv_ro(xf::cv::Mat& _uv, xf::cv::Mat& _u, xf::cv::Mat& _v, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) UV0[16], UV1[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=UV0 complete #pragma HLS ARRAY_PARTITION variable=UV1 complete // clang-format on unsigned long long int idx = 0, idx1 = 0; XF_SNAME(WORDWIDTH_DST) UPacked, VPacked; XF_SNAME(WORDWIDTH_SRC) UVPacked0, UVPacked1; ap_uint<13> i, j; rowloop: for (i = 0; i < (height >> 1); i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < ((width >> XF_BITSHIFT(NPC)) >> 1); j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on UVPacked0 = _uv.read(idx++); UVPacked1 = _uv.read(idx++); xfExtractPixels(UV0, UVPacked0, 0); xfExtractPixels(UV1, UVPacked1, 0); // Packing the U and V by picking even indeces for U and odd indeces for V #define AU_CVT_STEP 16 int sft = 1 << (XF_BITSHIFT(NPC) + 2); int l; ap_uint<9> k; for (int k = 0, l = 0; k < (1 << (XF_BITSHIFT(NPC))); k += 4, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on VPacked.range(l + AU_CVT_STEP - 1, l) = (UV0[k + 1]) | ((ap_uint<16>)UV0[k + 3] << (8)); UPacked.range(l + AU_CVT_STEP - 1, l) = (UV0[k]) | ((ap_uint<16>)UV0[k + 2] << (8)); VPacked.range(l + sft + AU_CVT_STEP - 1, l + sft) = (UV1[k + 1]) | ((ap_uint<16>)UV1[k + 3] << (8)); UPacked.range(l + sft + AU_CVT_STEP - 1, l + sft) = (UV1[k]) | ((ap_uint<16>)UV1[k + 2] << (8)); } _u.write(idx1, UPacked); _v.write(idx1++, VPacked); } } } // KernNv122Rgba template void KernNv122Rgba_ro(xf::cv::Mat& in_y, xf::cv::Mat& in_uv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { // width=width>>NPC; XF_PTNAME(XF_8UP) RGB[64], Ybuf[16], UVbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete // clang-format on hls::stream UVStream; // clang-format off #pragma HLS STREAM variable=&UVStream depth=COLS // clang-format on XF_SNAME(WORDWIDTH_Y) YPacked; XF_SNAME(WORDWIDTH_UV) UVPacked; XF_SNAME(WORDWIDTH_DST) PackedPixels; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; unsigned long long int uv_idx = 0, out_idx = 0; int8_t U, V; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YPacked = in_y.read(i * width + j); xfExtractPixels(Ybuf, YPacked, 0); if (evenRow) { UVPacked = in_uv.read(uv_idx++); UVStream.write(UVPacked); } else // Keep a copy of UV row data in stream to use for oddrow UVPacked = UVStream.read(); xfExtractPixels(UVbuf, UVPacked, 0); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on // Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // Y01 = (Ybuf[(k<<1)+1] > 16) ? (Ybuf[(k<<1)+1] - 16) : 0; if ((Ybuf[k << 1] > 16)) { Y00 = (Ybuf[k << 1] - 16); } else { Y00 = 0; } if ((Ybuf[(k << 1) + 1] > 16)) { Y01 = (Ybuf[(k << 1) + 1] - 16); } else { Y01 = 0; } U = UVbuf[k << 1] - 128; V = UVbuf[(k << 1) + 1] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + 0.596*V // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y - 0.813*V - 0.391*U // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + 0.018*U if (PLANES == 4) { RGB[(k << 3) + 0] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; // A RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k << 3) + 7] = 255; // A } else { RGB[(k * 6) + 0] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 3] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateB(Y01, U2Btemp, U); // B0 } } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } evenRow = evenRow ? false : true; } // if(height & 1) // { // for(int i = 0; i < (width>>NPC); i++) // { //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // UVStream.read(); // } // } } // KernNv122Rgba template void KernNv122bgr_ro(xf::cv::Mat& in_y, xf::cv::Mat& in_uv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { // width=width>>NPC; XF_PTNAME(XF_8UP) RGB[64], Ybuf[16], UVbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete // clang-format on hls::stream UVStream; // clang-format off #pragma HLS STREAM variable=&UVStream depth=COLS // clang-format on XF_SNAME(WORDWIDTH_Y) YPacked; XF_SNAME(WORDWIDTH_UV) UVPacked; XF_SNAME(WORDWIDTH_DST) PackedPixels; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; unsigned long long int uv_idx = 0, out_idx = 0; int8_t U, V; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YPacked = in_y.read(i * width + j); xfExtractPixels(Ybuf, YPacked, 0); if (evenRow) { UVPacked = in_uv.read(uv_idx++); UVStream.write(UVPacked); } else // Keep a copy of UV row data in stream to use for oddrow UVPacked = UVStream.read(); xfExtractPixels(UVbuf, UVPacked, 0); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on // Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // Y01 = (Ybuf[(k<<1)+1] > 16) ? (Ybuf[(k<<1)+1] - 16) : 0; if ((Ybuf[k << 1] > 16)) { Y00 = (Ybuf[k << 1] - 16); } else { Y00 = 0; } if ((Ybuf[(k << 1) + 1] > 16)) { Y01 = (Ybuf[(k << 1) + 1] - 16); } else { Y01 = 0; } U = UVbuf[k << 1] - 128; V = UVbuf[(k << 1) + 1] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + 0.596*V // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y - 0.813*V - 0.391*U // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + 0.018*U if (PLANES == 4) { RGB[(k << 3) + 0] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; // A RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k << 3) + 7] = 255; // A } else { RGB[(k * 6) + 0] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 3] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateR(Y01, V2Rtemp, V); // R1 } } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } evenRow = evenRow ? false : true; } // if(height & 1) // { // for(int i = 0; i < (width>>NPC); i++) // { //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // UVStream.read(); // } // } } // KernNv122Yuv4 template void KernNv122Yuv4_ro(xf::cv::Mat& _uv, xf::cv::Mat& _u, xf::cv::Mat& _v, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) UV[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=UV complete // clang-format on ap_uint<13> i, j; XF_SNAME(WORDWIDTH_UV) UPacked; XF_SNAME(WORDWIDTH_DST) VPacked, UVPacked; XF_SNAME(WORDWIDTH_DST) arr_UPacked[COLS >> (XF_BITSHIFT(NPC))], arr_VPacked[COLS >> (XF_BITSHIFT(NPC))]; unsigned long long int idx = 0, idx1 = 0; rowloop: for (i = 0; i < (height >> 1); i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < (width >> XF_BITSHIFT(NPC)); j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on UVPacked = _uv.read(idx1++); xfExtractPixels(UV, UVPacked, 0); #define AU_CVT_STEP 16 for (int k = 0, l = 0; k < (1 << (XF_BITSHIFT(NPC))); k += 2, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on VPacked.range(l + AU_CVT_STEP - 1, l) = (UV[k + 1]) | ((ap_uint<16>)UV[k + 1] << (8)); UPacked.range(l + AU_CVT_STEP - 1, l) = (UV[k]) | ((ap_uint<16>)UV[k] << (8)); } _u.write(((i * 2) * (_u.cols >> XF_BITSHIFT(NPC))) + j, UPacked); _v.write(((i * 2) * (_v.cols >> XF_BITSHIFT(NPC))) + j, VPacked); arr_UPacked[j] = UPacked; arr_VPacked[j] = VPacked; } for (j = 0; j < (width >> XF_BITSHIFT(NPC)); j++) { _u.write((((i * 2) + 1) * (_u.cols >> XF_BITSHIFT(NPC))) + j, arr_UPacked[j]); _v.write((((i * 2) + 1) * (_v.cols >> XF_BITSHIFT(NPC))) + j, arr_VPacked[j]); } } } // KernNv212Iyuv template void KernNv212Iyuv_ro(xf::cv::Mat& in_uv, xf::cv::Mat& u_out, xf::cv::Mat& v_out, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) VU0[16], VU1[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=VU0 complete #pragma HLS ARRAY_PARTITION variable=VU1 complete // clang-format on ap_uint<13> i, j; XF_SNAME(WORDWIDTH_DST) UPacked, VPacked; XF_SNAME(WORDWIDTH_SRC) VUPacked0, VUPacked1; unsigned long long int idx = 0, idx1 = 0; int l; ap_uint<4> k; rowloop: for (i = 0; i < (height >> 1); i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < ((width >> XF_BITSHIFT(NPC)) >> 1); j++) { // reading UV pixel interleaved data and writing them into // UStream and VStream // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on VUPacked0 = in_uv.read(idx++); VUPacked1 = in_uv.read(idx++); xfExtractPixels(VU0, VUPacked0, 0); xfExtractPixels(VU1, VUPacked1, 0); #define AU_CVT_STEP 16 int sft = 1 << (XF_BITSHIFT(NPC) + 2); for (k = 0, l = 0; k < (1 << (XF_BITSHIFT(NPC))); k += 4, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on UPacked.range(l + AU_CVT_STEP - 1, l) = (VU0[k + 1]) | ((ap_uint<16>)VU0[k + 3] << (8)); VPacked.range(l + AU_CVT_STEP - 1, l) = (VU0[k]) | ((ap_uint<16>)VU0[k + 2] << (8)); UPacked.range(l + sft + AU_CVT_STEP - 1, l + sft) = (VU1[k + 1]) | ((ap_uint<16>)VU1[k + 3] << (8)); VPacked.range(l + sft + AU_CVT_STEP - 1, l + sft) = (VU1[k]) | ((ap_uint<16>)VU1[k + 2] << (8)); } u_out.write(idx1, UPacked); v_out.write(idx1, VPacked); idx1++; } } /* if((height>>1)& 0x1) { // Writing 0's to fill the stream if the UV plane width is odd for(int i = 0; i < ((width>>XF_BITSHIFT(NPC))>>1); i++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on u_out.write(idx1,0); v_out.write(idx1++,0); } }*/ } // template void // KernNv212bgr_ro(xf::cv::Mat & // in_y,xf::cv::Mat & in_uv,xf::cv::Mat & rgba,uint16_t // height,uint16_t width) //{ // XF_PTNAME(XF_8UP) RGB[64],Ybuf[16],UVbuf[16]; //#pragma HLS ARRAY_PARTITION variable=RGB complete //#pragma HLS ARRAY_PARTITION variable=Ybuf complete //#pragma HLS ARRAY_PARTITION variable=UVbuf complete // ap_uint<13> i,j; // unsigned long long int in_idx=0,out_idx=0; // int k; // hls::stream UVStream; //#pragma HLS STREAM variable=&UVStream depth=COLS // XF_SNAME(WORDWIDTH_Y) YPacked; XF_SNAME(WORDWIDTH_UV) UVPacked; // XF_SNAME(WORDWIDTH_DST) PackedPixels; // uint8_t Y00, Y01; // int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; // int8_t U, V; // bool evenRow = true; // rowloop: // for( i = 0; i < height; i++) // { //#pragma HLS LOOP_FLATTEN off //#pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // columnloop: // for( j = 0; j < width; j++) // { //#pragma HLS pipeline //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // YPacked = in_y.read(i*width+j); // xfExtractPixels(Ybuf, YPacked, // 0); // if(evenRow) // { // UVPacked = in_uv.read(in_idx++); // UVStream.write(UVPacked); // } // else // Keep a copy of UV row data in stream to use for // oddrow // { // UVPacked = UVStream.read(); // } // // xfExtractPixels(UVbuf, // UVPacked, // 0); // for( k = 0; k < (1<>1; k++) // { //#pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC //#pragma HLS unroll // //Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // //Y01 = (Ybuf[(k<<1)+1] > 16) ? //(Ybuf[(k<<1)+1]-16) //: // 0; // // if((Ybuf[k<<1] > 16)) // { // Y00 = (Ybuf[k<<1]-16); // } // else // { // Y00 = 0; // } // // if((Ybuf[(k<<1)+1] > 16)) // { // Y01 = (Ybuf[(k<<1)+1]-16); // } // else // { // Y01 = 0; // } // // V = UVbuf[k<<1] - 128; // U = UVbuf[(k<<1)+1] - 128; // // V2Rtemp = V * (short int)V2R; // U2Gtemp = (short int)U2G * U; // V2Gtemp = (short int)V2G * V; // U2Btemp = U * (short int)U2B; // // // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + // 0.596*V // // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y //- // 0.813*V - 0.391*U // // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + // 0.018*U // // RGB[(k*6) + 0] = // CalculateB(Y00,U2Btemp,U); // RGB[(k*6) + 1] = // CalculateG(Y00,U2Gtemp,V2Gtemp); //G0 // RGB[(k*6) + 2] = // CalculateR(Y00,V2Rtemp,V); // RGB[(k*6) + 3] = // CalculateB(Y01,U2Btemp,U); // RGB[(k*6) + 4] = // CalculateG(Y01,U2Gtemp,V2Gtemp); //G1 // RGB[(k*6) + 5] = // CalculateR(Y01,V2Rtemp,V); // // } // // PackedPixels = PackRGBAPixels(RGB); // rgba.write(out_idx++,PackedPixels); // } // evenRow = evenRow ? false : true; // } //} template void KernNv212Rgba_ro(xf::cv::Mat& in_y, xf::cv::Mat& in_uv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) RGB[64], Ybuf[16], UVbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete // clang-format on ap_uint<13> i, j; unsigned long long int in_idx = 0, out_idx = 0; int k; hls::stream UVStream; // clang-format off #pragma HLS STREAM variable=&UVStream depth=COLS // clang-format on XF_SNAME(WORDWIDTH_Y) YPacked; XF_SNAME(WORDWIDTH_UV) UVPacked; XF_SNAME(WORDWIDTH_DST) PackedPixels; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; bool evenRow = true; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YPacked = in_y.read(i * width + j); xfExtractPixels(Ybuf, YPacked, 0); if (evenRow) { UVPacked = in_uv.read(in_idx++); UVStream.write(UVPacked); } else // Keep a copy of UV row data in stream to use for oddrow UVPacked = UVStream.read(); xfExtractPixels(UVbuf, UVPacked, 0); for (k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on // Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // Y01 = (Ybuf[(k<<1)+1] > 16) ? (Ybuf[(k<<1)+1]-16) : 0; if ((Ybuf[k << 1] > 16)) { Y00 = (Ybuf[k << 1] - 16); } else { Y00 = 0; } if ((Ybuf[(k << 1) + 1] > 16)) { Y01 = (Ybuf[(k << 1) + 1] - 16); } else { Y01 = 0; } V = UVbuf[k << 1] - 128; U = UVbuf[(k << 1) + 1] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + 0.596*V // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y - 0.813*V - 0.391*U // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + 0.018*U if (PLANES == 4) { RGB[(k << 3) + 0] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; // A RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k << 3) + 7] = 255; // A } else { RGB[(k * 6) + 0] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 3] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateB(Y01, U2Btemp, U); // B0 } } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } evenRow = evenRow ? false : true; } // if(height & 1) // { // for( i = 0; i < (width>>XF_BITSHIFT(NPC)); i++) // { //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // UVStream.read(); // } // } } template void KernNv212bgr_ro(xf::cv::Mat& in_y, xf::cv::Mat& in_uv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) RGB[64], Ybuf[16], UVbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete // clang-format on ap_uint<13> i, j; unsigned long long int in_idx = 0, out_idx = 0; int k; hls::stream UVStream; // clang-format off #pragma HLS STREAM variable=&UVStream depth=COLS // clang-format on XF_SNAME(WORDWIDTH_Y) YPacked; XF_SNAME(WORDWIDTH_UV) UVPacked; XF_SNAME(WORDWIDTH_DST) PackedPixels; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; bool evenRow = true; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YPacked = in_y.read(i * width + j); xfExtractPixels(Ybuf, YPacked, 0); if (evenRow) { UVPacked = in_uv.read(in_idx++); UVStream.write(UVPacked); } else // Keep a copy of UV row data in stream to use for oddrow UVPacked = UVStream.read(); xfExtractPixels(UVbuf, UVPacked, 0); for (k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on // Y00 = (Ybuf[k<<1] > 16) ? (Ybuf[k<<1]-16) : 0; // Y01 = (Ybuf[(k<<1)+1] > 16) ? (Ybuf[(k<<1)+1]-16) : 0; if ((Ybuf[k << 1] > 16)) { Y00 = (Ybuf[k << 1] - 16); } else { Y00 = 0; } if ((Ybuf[(k << 1) + 1] > 16)) { Y01 = (Ybuf[(k << 1) + 1] - 16); } else { Y01 = 0; } V = UVbuf[k << 1] - 128; U = UVbuf[(k << 1) + 1] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; // R = 1.164*Y + 1.596*V = Y + 0.164*Y + V + 0.596*V // G = 1.164*Y - 0.813*V - 0.391*U = Y + 0.164*Y - 0.813*V - 0.391*U // B = 1.164*Y + 2.018*U = Y + 0.164 + 2*U + 0.018*U // if(PLANES==4) // { // RGB[(k<<3) + 0] = // CalculateR(Y00,V2Rtemp,V); // RGB[(k<<3) + 1] = // CalculateG(Y00,U2Gtemp,V2Gtemp); //G0 // RGB[(k<<3) + 2] = // CalculateB(Y00,U2Btemp,U); // RGB[(k<<3) + 3] = 255; // RGB[(k<<3) + 4] = // CalculateR(Y01,V2Rtemp,V); // RGB[(k<<3) + 5] = // CalculateG(Y01,U2Gtemp,V2Gtemp); //G1 // RGB[(k<<3) + 6] = // CalculateB(Y01,U2Btemp,U); // RGB[(k<<3) + 7] = 255; // } // else // { RGB[(k * 6) + 0] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 3] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateR(Y01, V2Rtemp, V); // R1 // } } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } evenRow = evenRow ? false : true; } // if(height & 1) // { // for( i = 0; i < (width>>XF_BITSHIFT(NPC)); i++) // { //#pragma HLS LOOP_TRIPCOUNT min=TC max=TC // UVStream.read(); // } // } } // KernNv212Yuv4 template void KernNv212Yuv4_ro(xf::cv::Mat& _vu, xf::cv::Mat& _u, xf::cv::Mat& _v, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) VUbuf[16]; // clang-format off #pragma HLS ARRAY_PARTITION variable=VUbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) UPacked, VPacked; XF_SNAME(WORDWIDTH_VU) VUPacked; XF_SNAME(WORDWIDTH_DST) arr_UPacked[COLS >> (XF_BITSHIFT(NPC))], arr_VPacked[COLS >> (XF_BITSHIFT(NPC))]; ap_uint<13> i, j; ap_uint<4> k; unsigned long long int idx = 0, idx1 = 0; int l; rowloop: for (i = 0; i < (height >> 1); i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (j = 0; j < (width >> XF_BITSHIFT(NPC)); j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on VUPacked = _vu.read(idx1++); xfExtractPixels(VUbuf, VUPacked, 0); #define AU_CVT_STEP 16 for (k = 0, l = 0; k < (1 << (XF_BITSHIFT(NPC))); k += 2, l += AU_CVT_STEP) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS UNROLL // clang-format on UPacked.range(l + AU_CVT_STEP - 1, l) = (VUbuf[k + 1]) | ((ap_uint<16>)VUbuf[k + 1] << (8)); VPacked.range(l + AU_CVT_STEP - 1, l) = (VUbuf[k]) | ((ap_uint<16>)VUbuf[k] << (8)); } //_u.write(idx,UPacked); //_v.write(idx++,VPacked); _u.write(((i * 2) * (_u.cols >> XF_BITSHIFT(NPC))) + j, UPacked); _v.write(((i * 2) * (_v.cols >> XF_BITSHIFT(NPC))) + j, VPacked); arr_UPacked[j] = UPacked; arr_VPacked[j] = VPacked; } for (j = 0; j < (width >> XF_BITSHIFT(NPC)); j++) { _u.write((((i * 2) + 1) * (_u.cols >> XF_BITSHIFT(NPC))) + j, arr_UPacked[j]); _v.write((((i * 2) + 1) * (_v.cols >> XF_BITSHIFT(NPC))) + j, arr_VPacked[j]); } } } // KernYuyv2Rgba template void KernYuyv2Rgba_ro(xf::cv::Mat& yuyv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { ap_uint8_t RGB[64]; XF_PTNAME(XF_8UP) YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) PackedPixels; XF_SNAME(WORDWIDTH_SRC) YUVPacked; unsigned long long int idx = 0; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = yuyv.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k < (XF_NPIXPERCYCLE(NPC) >> 1); k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC // clang-format on // Y00 = (YUVbuf[(k<<2)] > 16) ? (YUVbuf[(k<<2)]-16) : 0; if (YUVbuf[(k << 2)] > 16) { Y00 = (YUVbuf[(k << 2)] - 16); } else { Y00 = 0; } U = YUVbuf[(k << 2) + 1] - 128; // Y01 = (YUVbuf[(k<<2)+2] > 16) ? (YUVbuf[(k<<2)+2]-16) : 0; if (YUVbuf[(k << 2) + 2] > 16) { Y01 = YUVbuf[(k << 2) + 2] - 16; } else { Y01 = 0; } V = YUVbuf[(k << 2) + 3] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; if (PLANES == 4) { RGB[(k << 3)] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; // A RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k << 3) + 7] = 255; // A } else { RGB[(k * 6)] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 3] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateB(Y01, U2Btemp, U); // B0 } } PackedPixels = PackRGBAPixels(RGB); rgba.write(idx++, PackedPixels); } } } template void KernYuyv2bgr_ro(xf::cv::Mat& yuyv, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { ap_uint8_t RGB[64]; XF_PTNAME(XF_8UP) YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) PackedPixels; XF_SNAME(WORDWIDTH_SRC) YUVPacked; unsigned long long int idx = 0; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = yuyv.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k < (XF_NPIXPERCYCLE(NPC) >> 1); k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC // clang-format on // Y00 = (YUVbuf[(k<<2)] > 16) ? (YUVbuf[(k<<2)]-16) : 0; if (YUVbuf[(k << 2)] > 16) { Y00 = (YUVbuf[(k << 2)] - 16); } else { Y00 = 0; } U = YUVbuf[(k << 2) + 1] - 128; // Y01 = (YUVbuf[(k<<2)+2] > 16) ? (YUVbuf[(k<<2)+2]-16) : 0; if (YUVbuf[(k << 2) + 2] > 16) { Y01 = YUVbuf[(k << 2) + 2] - 16; } else { Y01 = 0; } V = YUVbuf[(k << 2) + 3] - 128; V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; RGB[(k * 6)] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateR(Y00, V2Rtemp, V); // R0 RGB[(k * 6) + 3] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateR(Y01, V2Rtemp, V); // R1 } PackedPixels = PackRGBAPixels(RGB); rgba.write(idx++, PackedPixels); } } } template void KernYuyv2Nv12_ro(xf::cv::Mat& _yuyv, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) Ybuf[16], UVbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _yuyv.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // filling the Ybuf and UVbuf in the format required for NV12 // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2)]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 2]; if (evenRow) { UVbuf[(k << 1)] = YUVbuf[(k << 2) + 1]; UVbuf[(k << 1) + 1] = YUVbuf[(k << 2) + 3]; } } YPacked = PackPixels(Ybuf); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UVbuf); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } template void KernYuyv2Nv21_ro(xf::cv::Mat& _yuyv, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { XF_PTNAME(XF_8UP) Ybuf[16], UVbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _yuyv.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // filling the Ybuf and UVbuf in the format required for NV12 // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2)]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 2]; if (evenRow) { UVbuf[(k << 1) + 1] = YUVbuf[(k << 2) + 1]; UVbuf[(k << 1)] = YUVbuf[(k << 2) + 3]; } } YPacked = PackPixels(Ybuf); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UVbuf); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } template void KernYuyv2Iyuv_ro(xf::cv::Mat& _yuyv, xf::cv::Mat& _y, xf::cv::Mat& _u, xf::cv::Mat& _v, uint16_t height, uint16_t width) { uint16_t i, j, k, l; ap_uint8_t Ybuf[16], Ubuf[16], Vbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=Ubuf complete #pragma HLS ARRAY_PARTITION variable=Vbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on unsigned long long int idx = 0, idx1 = 0; XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_DST) YPacked0, UPacked, VPacked; uint8_t offset; bool evenRow = true, evenBlock = true; offset = (1 << XF_BITSHIFT(NPC)) >> 1; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _yuyv.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2)]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 2]; if (evenRow) { if (evenBlock) { Ubuf[k] = YUVbuf[(k << 2) + 1]; Vbuf[k] = YUVbuf[(k << 2) + 3]; } else { Ubuf[k + offset] = YUVbuf[(k << 2) + 1]; Vbuf[k + offset] = YUVbuf[(k << 2) + 3]; } } } YPacked0 = PackPixels(Ybuf); _y.write(idx++, YPacked0); if (evenRow & !evenBlock) { UPacked = PackPixels(Ubuf); VPacked = PackPixels(Vbuf); _u.write(idx1, UPacked); _v.write(idx1++, VPacked); } evenBlock = evenBlock ? false : true; } evenRow = evenRow ? false : true; } } // KernUyvy2Iyuv template void KernUyvy2Iyuv_ro(xf::cv::Mat& _uyvy, xf::cv::Mat& y_plane, xf::cv::Mat& u_plane, xf::cv::Mat& v_plane, uint16_t height, uint16_t width) { ap_uint8_t Ybuf[16], Ubuf[16], Vbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=Ubuf complete #pragma HLS ARRAY_PARTITION variable=Vbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_DST) YPacked0, UPacked, VPacked; uint8_t offset; unsigned long long int idx = 0, idx1 = 0; bool evenRow = true, evenBlock = true; offset = (1 << XF_BITSHIFT(NPC)) >> 1; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _uyvy.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2) + 1]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 3]; if (evenRow) { if (evenBlock) { Ubuf[k] = YUVbuf[(k << 2)]; Vbuf[k] = YUVbuf[(k << 2) + 2]; } else { Ubuf[k + offset] = YUVbuf[(k << 2)]; Vbuf[k + offset] = YUVbuf[(k << 2) + 2]; } } } YPacked0 = PackPixels(Ybuf); y_plane.write(idx1++, YPacked0); if (evenRow & !evenBlock) { UPacked = PackPixels(Ubuf); VPacked = PackPixels(Vbuf); u_plane.write(idx, UPacked); v_plane.write(idx++, VPacked); } evenBlock = evenBlock ? false : true; } evenRow = evenRow ? false : true; } } template void KernUyvy2Nv12_ro(xf::cv::Mat& _uyvy, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { ap_uint8_t Ybuf[16], UVbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long int idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _uyvy.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); // filling the Ybuf and UVbuf in the format required for NV12 for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2) + 1]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 3]; if (evenRow) { UVbuf[(k << 1)] = YUVbuf[(k << 2)]; UVbuf[(k << 1) + 1] = YUVbuf[(k << 2) + 2]; } } YPacked = PackPixels(Ybuf); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UVbuf); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } // KernUyvy2Nv21 template void KernUyvy2Nv21_ro(xf::cv::Mat& _uyvy, xf::cv::Mat& y_plane, xf::cv::Mat& uv_plane, uint16_t height, uint16_t width) { ap_uint8_t Ybuf[16], UVbuf[16], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=Ybuf complete #pragma HLS ARRAY_PARTITION variable=UVbuf complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_SRC) YUVPacked; XF_SNAME(WORDWIDTH_Y) YPacked, UVPacked; unsigned long long int idx = 0, idx1 = 0; bool evenRow = true; rowloop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on columnloop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=TC max=TC // clang-format on YUVPacked = _uyvy.read(i * width + j); ExtractUYVYPixels(YUVPacked, YUVbuf); // filling the Ybuf and UVbuf in the format required for NV12 for (int k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on Ybuf[(k << 1)] = YUVbuf[(k << 2) + 1]; Ybuf[(k << 1) + 1] = YUVbuf[(k << 2) + 3]; if (evenRow) { UVbuf[(k << 1)] = YUVbuf[(k << 2) + 2]; UVbuf[(k << 1) + 1] = YUVbuf[(k << 2)]; } } YPacked = PackPixels(Ybuf); y_plane.write(idx++, YPacked); if (evenRow) { UVPacked = PackPixels(UVbuf); uv_plane.write(idx1++, UVPacked); } } evenRow = evenRow ? false : true; } } template void KernUyvy2Rgb_ro(xf::cv::Mat& uyvy, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { uint16_t i, j, k; XF_PTNAME(XF_8UP) RGB[64], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) PackedPixels; XF_SNAME(WORDWIDTH_SRC) YUVPacked; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; unsigned long long int idx = 0, out_idx = 0; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS #pragma HLS LOOP_FLATTEN off // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=TC max=TC #pragma HLS pipeline // clang-format on YUVPacked = uyvy.read(idx++); ExtractUYVYPixels(YUVPacked, YUVbuf); for (k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on U = YUVbuf[(k << 2)] - 128; // Y00 = (YUVbuf[(k<<2) + 1] > 16) ? (YUVbuf[(k<<2) + 1] - 16):0; if (YUVbuf[(k << 2) + 1] > 16) { Y00 = (YUVbuf[(k << 2) + 1] - 16); } else { Y00 = 0; } V = YUVbuf[(k << 2) + 2] - 128; // Y01 = (YUVbuf[(k<<2) + 3] > 16) ? (YUVbuf[(k<<2) + 3] - 16):0; if ((YUVbuf[(k << 2) + 3] > 16)) { Y01 = (YUVbuf[(k << 2) + 3] - 16); } else { Y01 = 0; } V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; RGB[(k * 6)] = CalculateR(Y00, V2Rtemp, V); // G0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 3] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateB(Y01, U2Btemp, U); // B0 } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } } } template void KernUyvy2bgr_ro(xf::cv::Mat& uyvy, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { uint16_t i, j, k; XF_PTNAME(XF_8UP) RGB[64], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) PackedPixels; XF_SNAME(WORDWIDTH_SRC) YUVPacked; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; unsigned long long int idx = 0, out_idx = 0; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS #pragma HLS LOOP_FLATTEN off // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=TC max=TC #pragma HLS pipeline // clang-format on YUVPacked = uyvy.read(idx++); ExtractUYVYPixels(YUVPacked, YUVbuf); for (k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on U = YUVbuf[(k << 2)] - 128; // Y00 = (YUVbuf[(k<<2) + 1] > 16) ? (YUVbuf[(k<<2) + 1] - 16):0; if (YUVbuf[(k << 2) + 1] > 16) { Y00 = (YUVbuf[(k << 2) + 1] - 16); } else { Y00 = 0; } V = YUVbuf[(k << 2) + 2] - 128; // Y01 = (YUVbuf[(k<<2) + 3] > 16) ? (YUVbuf[(k<<2) + 3] - 16):0; if ((YUVbuf[(k << 2) + 3] > 16)) { Y01 = (YUVbuf[(k << 2) + 3] - 16); } else { Y01 = 0; } V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; RGB[(k * 6)] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k * 6) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k * 6) + 2] = CalculateR(Y00, V2Rtemp, V); // G0 RGB[(k * 6) + 3] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k * 6) + 4] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k * 6) + 5] = CalculateR(Y01, V2Rtemp, V); // R1 } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } } } template void KernUyvy2Rgba_ro(xf::cv::Mat& uyvy, xf::cv::Mat& rgba, uint16_t height, uint16_t width) { uint16_t i, j, k; XF_PTNAME(XF_8UP) RGB[64], YUVbuf[32]; // clang-format off #pragma HLS ARRAY_PARTITION variable=RGB complete #pragma HLS ARRAY_PARTITION variable=YUVbuf complete // clang-format on XF_SNAME(WORDWIDTH_DST) PackedPixels; XF_SNAME(WORDWIDTH_SRC) YUVPacked; uint8_t Y00, Y01; int32_t V2Rtemp, U2Gtemp, V2Gtemp, U2Btemp; int8_t U, V; unsigned long long int idx = 0, out_idx = 0; rowloop: for (i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS #pragma HLS LOOP_FLATTEN off // clang-format on columnloop: for (j = 0; j < width; j++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=TC max=TC #pragma HLS pipeline // clang-format on YUVPacked = uyvy.read(idx++); ExtractUYVYPixels(YUVPacked, YUVbuf); for (k = 0; k<(1 << XF_BITSHIFT(NPC))>> 1; k++) { // clang-format off #pragma HLS LOOP_TRIPCOUNT min=iTC max=iTC #pragma HLS unroll // clang-format on U = YUVbuf[(k << 2)] - 128; // Y00 = (YUVbuf[(k<<2) + 1] > 16) ? (YUVbuf[(k<<2) + 1] - 16):0; if (YUVbuf[(k << 2) + 1] > 16) { Y00 = (YUVbuf[(k << 2) + 1] - 16); } else { Y00 = 0; } V = YUVbuf[(k << 2) + 2] - 128; // Y01 = (YUVbuf[(k<<2) + 3] > 16) ? (YUVbuf[(k<<2) + 3] - 16):0; if ((YUVbuf[(k << 2) + 3] > 16)) { Y01 = (YUVbuf[(k << 2) + 3] - 16); } else { Y01 = 0; } V2Rtemp = V * (short int)V2R; U2Gtemp = (short int)U2G * U; V2Gtemp = (short int)V2G * V; U2Btemp = U * (short int)U2B; RGB[(k << 3)] = CalculateR(Y00, V2Rtemp, V); // G0 RGB[(k << 3) + 1] = CalculateG(Y00, U2Gtemp, V2Gtemp); // G0 RGB[(k << 3) + 2] = CalculateB(Y00, U2Btemp, U); // B0 RGB[(k << 3) + 3] = 255; RGB[(k << 3) + 4] = CalculateR(Y01, V2Rtemp, V); // R1 RGB[(k << 3) + 5] = CalculateG(Y01, U2Gtemp, V2Gtemp); // G1 RGB[(k << 3) + 6] = CalculateB(Y01, U2Btemp, U); // B0 RGB[(k << 3) + 7] = 255; } PackedPixels = PackRGBAPixels(RGB); rgba.write(out_idx++, PackedPixels); } } } /******************************************************************************** * Color Conversion APIs *******************************************************************************/ template void xFRgba2Yuv4(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == 1) { KernRgba2Yuv4(_src, _y_image, _u_image, _v_image, height, width); } else { KernRgba2Yuv4_ro> XF_BITSHIFT(NPC)), ((1 << XF_BITSHIFT(NPC)) >> 1)>(_src, _y_image, _u_image, _v_image, height, width); } } template void rgba2yuv4(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC4) && " RGBA image Type must be XF_8UC4"); assert((DST_T == XF_8UC1) && " Y, U, V image Type must be XF_8UC1"); assert(((_src.rows <= ROWS) && (_src.cols <= COLS)) && " RGBA image rows and cols should be less than ROWS, COLS"); assert(((_src.cols == _y_image.cols) && (_src.rows == _y_image.rows)) && "RGBA and Y plane dimensions mismatch"); assert(((_src.cols == _u_image.cols) && (_src.rows == _u_image.rows)) && "RGBA and U plane dimensions mismatch"); assert(((_src.cols == _v_image.cols) && (_src.rows == _v_image.rows)) && "RGBA and V plane dimensions mismatch"); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); #endif xFRgba2Yuv4( _src, _y_image, _u_image, _v_image, _src.rows, _src.cols); } template void KernRgb2Iyuv(xf::cv::Mat& _rgba, xf::cv::Mat& _y, xf::cv::Mat& _u, xf::cv::Mat& _v, uint16_t height, uint16_t width) { ap_uint<24> rgba; uint8_t y, u, v; bool evenRow = true, evenBlock = true; unsigned long long int idx = 0, idx1 = 0; RowLoop: for (int i = 0; i < height; i++) { // clang-format off #pragma HLS LOOP_FLATTEN off #pragma HLS LOOP_TRIPCOUNT min=ROWS max=ROWS // clang-format on ColLoop: for (int j = 0; j < width; j++) { // clang-format off #pragma HLS pipeline #pragma HLS LOOP_TRIPCOUNT min=COLS max=COLS // clang-format on rgba = _rgba.read(i * width + j); uint8_t r = rgba.range(7, 0); uint8_t g = rgba.range(15, 8); uint8_t b = rgba.range(23, 16); y = CalculateY(r, g, b); if (evenRow) { if (evenBlock) { u = CalculateU(r, g, b); v = CalculateV(r, g, b); } } _y.write(idx++, y); if (evenRow & !evenBlock) { _u.write(idx1, u); _v.write(idx1++, v); } evenBlock = evenBlock ? false : true; } evenRow = evenRow ? false : true; } } template void xFRgb2Iyuv(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == XF_NPPC1) { KernRgb2Iyuv( _src, _y_image, _u_image, _v_image, height, width); } else { KernRgba2Iyuv_ro> XF_BITSHIFT(NPC)), ((1 << XF_BITSHIFT(NPC)) >> 1)>(_src, _y_image, _u_image, _v_image, height, width); } } template void rgb2iyuv(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC3) && " RGB image Type must be XF_8UC3"); assert((DST_T == XF_8UC1) && " Y, U, V image Type must be XF_8UC1"); assert(((_src.rows <= ROWS) && (_src.cols <= COLS)) && " RGB image rows and cols should be less than ROWS, COLS"); assert(((_src.cols == _y_image.cols) && (_src.rows == _y_image.rows)) && "RGB and Y plane dimensions mismatch"); assert(((_src.cols == _u_image.cols) && (_src.rows == (_u_image.rows << 2))) && "RGB and U plane dimensions mismatch"); assert(((_src.cols == _v_image.cols) && (_src.rows == (_v_image.rows << 2))) && "RGB and V plane dimensions mismatch"); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); #endif xFRgb2Iyuv( _src, _y_image, _u_image, _v_image, _src.rows, _src.cols); } template void xFRgba2Iyuv(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == XF_NPPC1) { KernRgba2Iyuv( _src, _y_image, _u_image, _v_image, height, width); } else { KernRgba2Iyuv_ro> XF_BITSHIFT(NPC)), ((1 << XF_BITSHIFT(NPC)) >> 1)>(_src, _y_image, _u_image, _v_image, height, width); } } template void rgba2iyuv(xf::cv::Mat& _src, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC4) && " RGBA image Type must be XF_8UC3"); assert((DST_T == XF_8UC1) && " Y, U, V image Type must be XF_8UC1"); assert(((_src.rows <= ROWS) && (_src.cols <= COLS)) && " RGBA image rows and cols should be less than ROWS, COLS"); assert(((_src.cols == _y_image.cols) && (_src.rows == _y_image.rows)) && "RGBA and Y plane dimensions mismatch"); assert(((_src.cols == _u_image.cols) && (_src.rows == (_u_image.rows << 2))) && "RGBA and U plane dimensions mismatch"); assert(((_src.cols == _v_image.cols) && (_src.rows == (_v_image.rows << 2))) && "RGBA and V plane dimensions mismatch"); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); #endif xFRgba2Iyuv( _src, _y_image, _u_image, _v_image, _src.rows, _src.cols); } // auRgba2Iyuv // template void xFRgba2Nv21(xf::cv::Mat& _src, xf::cv::Mat& _y, xf::cv::Mat& _uv, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == 1) { KernRgba2Nv21( _src, _y, _uv, height, width); } else { KernRgba2Nv21_ro> XF_BITSHIFT(NPC)), (1 << (XF_BITSHIFT(NPC) + 1))>(_src, _y, _uv, height, width); } } template void rgba2nv21(xf::cv::Mat& _src, xf::cv::Mat& _y, xf::cv::Mat& _uv) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC4) && " RGBA image Type must be XF_8UC3"); assert((Y_T == XF_8UC1) && " Y image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " VU image Type must be XF_8UC2"); assert(((_src.rows <= ROWS) && (_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((_src.cols == _y.cols) && (_src.rows == _y.rows)) && "Y and RGBA plane dimensions mismatch"); assert(((_y.cols == (_uv.cols << 1)) && (_y.rows == (_uv.rows << 1))) && "Y and VU planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the VU " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFRgba2Nv21(_src, _y, _uv, _src.rows, _src.cols); } template void xFRgba2Nv12(xf::cv::Mat& _src, xf::cv::Mat& _y, xf::cv::Mat& _uv, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == 1) { KernRgba2Nv12( _src, _y, _uv, height, width); } else { KernRgba2Nv12_ro> XF_BITSHIFT(NPC)), (1 << (XF_BITSHIFT(NPC) + 1))>(_src, _y, _uv, height, width); } } template void rgba2nv12(xf::cv::Mat& _src, xf::cv::Mat& _y, xf::cv::Mat& _uv) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC4) && " RGBA image Type must be XF_8UC3"); assert((Y_T == XF_8UC1) && " Y image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " UV image Type must be XF_8UC2"); assert(((_src.rows <= ROWS) && (_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((_src.cols == _y.cols) && (_src.rows == _y.rows)) && "Y and RGBA plane dimensions mismatch"); assert(((_y.cols == (_uv.cols << 1)) && (_y.rows == (_uv.rows << 1))) && "Y and UV planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the UV " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFRgba2Nv12(_src, _y, _uv, _src.rows, _src.cols); } // auRgba2Nv21 template void xFIyuv2Rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _dst0, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if ((NPC == XF_NPPC8)) { KernIyuv2Rgba_ro> XF_BITSHIFT(NPC)), (1 << (XF_BITSHIFT(NPC) + 1))>(src_y, src_u, src_v, _dst0, height, width); } else { KernIyuv2Rgba> XF_BITSHIFT(NPC))>( src_y, src_u, src_v, _dst0, height, width); } } template void iyuv2rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _dst0) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y, U, V images Type must be XF_8UC1"); assert((DST_T == XF_8UC4) && " RGBA image Type must be XF_8UC4"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == (_dst0.cols)) && (src_y.rows == _dst0.rows)) && "Y plane and RGBA dimensions mismatch"); assert(((src_u.cols == (_dst0.cols)) && (src_u.rows == (_dst0.rows >> 2))) && "U plane and RGBA dimensions mismatch"); assert(((src_v.cols == (_dst0.cols)) && (src_v.rows == (_dst0.rows >> 2))) && "V plane and RGBA dimensions mismatch"); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); #endif xFIyuv2Rgba( src_y, src_u, src_v, _dst0, src_y.rows, src_y.cols); } // Iyuv2Rgba template void xFIyuv2Yuv4(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { if (NPC == XF_NPPC8) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernIyuv2Yuv4_ro> XF_BITSHIFT(NPC)) >> 1), ((1 << XF_BITSHIFT(NPC)) >> 1)>(src_u, src_v, _u_image, _v_image, height, width); write_y_ro> XF_BITSHIFT(NPC))>(src_y, _y_image, height, width); } else if (NPC == XF_NPPC1) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernIyuv2Yuv4> 1), ((COLS >> XF_BITSHIFT(NPC)) >> 1)>( src_u, src_v, _u_image, _v_image, height, width); write_y> XF_BITSHIFT(NPC)), ROWS>(src_y, _y_image, height, width); } } template void iyuv2yuv4(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y, U, V images Type must be XF_8UC1"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == (_y_image.cols)) && (src_y.rows == _y_image.rows)) && "input and ouput Y planes dimensions mismatch"); assert(((src_u.cols == (_u_image.cols)) && (src_u.rows == (_u_image.rows >> 2))) && "input and ouput U dimensions mismatch"); assert(((src_v.cols == (_v_image.cols)) && (src_v.rows == (_v_image.rows >> 2))) && "input and ouput V dimensions mismatch"); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); #endif xFIyuv2Yuv4(src_y, src_u, src_v, _y_image, _u_image, _v_image, src_y.rows, src_y.cols); } template void xFIyuv2Nv12(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _y_image, xf::cv::Mat& _uv_image, uint16_t height, uint16_t width) { if (NPC == XF_NPPC8) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernIyuv2Nv12_ro> 1), ((COLS >> XF_BITSHIFT(NPC)) >> 1), ((1 << XF_BITSHIFT(NPC)) >> 1)>(src_u, src_v, _uv_image, height, width); write_y_ro> XF_BITSHIFT(NPC))>(src_y, _y_image, height, width); } else { // clang-format off #pragma HLS DATAFLOW // clang-format on KernIyuv2Nv12> 1), ((COLS >> XF_BITSHIFT(NPC)) >> 1)>(src_u, src_v, _uv_image, height, width); write_y> XF_BITSHIFT(NPC)), (ROWS >> 1)>(src_y, _y_image, height, width); } } template void iyuv2nv12(xf::cv::Mat& src_y, xf::cv::Mat& src_u, xf::cv::Mat& src_v, xf::cv::Mat& _y_image, xf::cv::Mat& _uv_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y, U, V images Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " UV image Type must be XF_8UC2"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == (_y_image.cols)) && (src_y.rows == _y_image.rows)) && "input and ouput Y planes dimensions mismatch"); assert(((src_y.cols == (src_u.cols)) && (src_y.rows == (src_u.rows << 2))) && "Y and U dimensions mismatch"); assert(((src_y.cols == (src_v.cols)) && (src_y.rows == (src_v.rows << 2))) && "Y and V dimensions mismatch"); assert(((src_y.cols == (_uv_image.cols << 1)) && (src_y.rows == (_uv_image.rows << 1))) && "input and ouput Y planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the UV " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFIyuv2Nv12( src_y, src_u, src_v, _y_image, _uv_image, src_y.rows, src_y.cols); } template void xFNv122Iyuv(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { if (NPC == XF_NPPC8) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv122Iyuv_ro> XF_BITSHIFT(NPC)) >> 1), ((1 << XF_BITSHIFT(NPC)) >> 2)>(src_uv, _u_image, _v_image, height, width); write_y_ro> XF_BITSHIFT(NPC))>(src_y, _y_image, height, width); } else { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv122Iyuv> XF_BITSHIFT(NPC)) >> 1)>(src_uv, _u_image, _v_image, height, width); write_y> XF_BITSHIFT(NPC)), (ROWS >> XF_BITSHIFT(NPC))>( src_y, _y_image, height, width); } } // Nv122Iyuv template void nv122iyuv(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y,U,V image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " UV image Type must be XF_8UC2"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == (src_uv.cols << 1)) && (src_y.rows == (src_uv.rows << 1))) && "Y and UV planes dimensions mismatch"); assert(((src_y.cols == _y_image.cols) && (src_y.rows == _y_image.rows)) && "Input and Outut Y planes dimensions mismatch"); assert(((src_y.cols == _u_image.cols) && (src_y.rows == (_u_image.rows << 2))) && "U, Y planes dimensions mismatch"); assert(((src_y.cols == _v_image.cols) && (src_y.rows == (_v_image.rows << 2))) && "V, Y planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the UV " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFNv122Iyuv( src_y, src_uv, _y_image, _u_image, _v_image, src_y.rows, src_y.cols); } template void xFNv122Rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _dst0, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == 1) { KernNv122Rgba( src_y, src_uv, _dst0, height, width); } else { KernNv122Rgba_ro> XF_BITSHIFT(NPC)), ((1 << XF_BITSHIFT(NPC)) >> 1)>(src_y, src_uv, _dst0, height, width); } } // Nv122Rgba template void nv122rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _dst0) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " UV image Type must be XF_8UC2"); assert((DST_T == XF_8UC4) && " RGBA image Type must be XF_8UC4"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == _dst0.cols) && (src_y.rows == _dst0.rows)) && "Y and RGBA Aplane dimensions mismatch"); assert(((src_y.cols == (src_uv.cols << 1)) && (src_y.rows == (src_uv.rows << 1))) && "Y and UV planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the UV " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC2) || (NPC == XF_NPPC4) || (NPC == XF_NPPC8)) && " 1,2,4,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC values must be same "); } #endif xFNv122Rgba(src_y, src_uv, _dst0, src_y.rows, src_y.cols); } template void xFNv122Yuv4(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { // assert(( (in_uv.cols == (u_out.cols)) && (in_uv.rows == //(u_out.rows>>1))) // && "UV plane and U plane dimensions mismatch"); // assert(( (in_uv.cols == (v_out.cols)) && (in_uv.rows == //(v_out.rows>>1))) // && "UV plane and V plane dimensions mismatch"); if (NPC == XF_NPPC8) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv122Yuv4_ro> XF_BITSHIFT(NPC)), ((1 << (XF_BITSHIFT(NPC))) >> 1)>(src_uv, _u_image, _v_image, height, width); write_y_ro> XF_BITSHIFT(NPC))>(src_y, _y_image, height, width); } else { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv122Yuv4> XF_BITSHIFT(NPC))>( src_uv, _u_image, _v_image, height, width); write_y> XF_BITSHIFT(NPC)), ROWS>(src_y, _y_image, height, width); } } // auNv122Yuv4 template void nv122yuv4(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on xFNv122Yuv4( src_y, src_uv, _y_image, _u_image, _v_image, src_y.rows, src_y.cols); } template void xFNv212Iyuv(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image, uint16_t height, uint16_t width) { if (NPC == XF_NPPC8) { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv212Iyuv_ro> XF_BITSHIFT(NPC)) >> 1), ((1 << XF_BITSHIFT(NPC)) >> 2)>(src_uv, _u_image, _v_image, height, width); write_y_ro> XF_BITSHIFT(NPC))>(src_y, _y_image, height, width); } else { // clang-format off #pragma HLS DATAFLOW // clang-format on KernNv212Iyuv> XF_BITSHIFT(NPC)) >> 1)>(src_uv, _u_image, _v_image, height, width); write_y> XF_BITSHIFT(NPC)), ROWS>(src_y, _y_image, height, width); } } // Nv212Iyuv template void nv212iyuv(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _y_image, xf::cv::Mat& _u_image, xf::cv::Mat& _v_image) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y,U,V image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " VU image Type must be XF_8UC2"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == (src_uv.cols << 1)) && (src_y.rows == (src_uv.rows << 1))) && "Y and VU planes dimensions mismatch"); assert(((src_y.cols == _y_image.cols) && (src_y.rows == _y_image.rows)) && "Input and Outut Y planes dimensions mismatch"); assert(((src_y.cols == _u_image.cols) && (src_y.rows == (_u_image.rows << 2))) && "U, Y planes dimensions mismatch"); assert(((src_y.cols == _v_image.cols) && (src_y.rows == (_v_image.rows << 2))) && "V, Y planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the VU " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFNv212Iyuv( src_y, src_uv, _y_image, _u_image, _v_image, src_y.rows, src_y.cols); } template void xFNv212Rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _dst0, uint16_t height, uint16_t width) { width = width >> XF_BITSHIFT(NPC); if (NPC == 1) { KernNv212Rgba( src_y, src_uv, _dst0, height, width); } else { KernNv212Rgba_ro> XF_BITSHIFT(NPC)), ((1 << XF_BITSHIFT(NPC)) >> 1)>(src_y, src_uv, _dst0, height, width); } } // Nv212Rgba template void nv212rgba(xf::cv::Mat& src_y, xf::cv::Mat& src_uv, xf::cv::Mat& _dst0) { // clang-format off #pragma HLS INLINE OFF // clang-format on #ifndef __SYNTHESIS__ assert((SRC_T == XF_8UC1) && " Y image Type must be XF_8UC1"); assert((UV_T == XF_8UC2) && " VU image Type must be XF_8UC2"); assert((DST_T == XF_8UC4) && " RGBA image Type must be XF_8UC4"); assert(((src_y.rows <= ROWS) && (src_y.cols <= COLS)) && " Y image ROWS and COLS should be less than ROWS, COLS"); assert(((src_y.cols == _dst0.cols) && (src_y.rows == _dst0.rows)) && "Y and RGBA Aplane dimensions mismatch"); assert(((src_y.cols == (src_uv.cols << 1)) && (src_y.rows == (src_uv.rows << 1))) && "Y and VU planes dimensions mismatch"); if (NPC != XF_NPPC1) { assert((NPC == (NPC_UV * 2)) && " NPC of Y plane must be double the VU " "plane for multipixel parallelism "); assert(((NPC == XF_NPPC1) || (NPC == XF_NPPC8)) && " 1,8 pixel parallelism is supported "); } else { assert((NPC == NPC_UV == XF_NPPC1) && " Both NPC,NPC_UV values must be same "); } #endif xFNv212Rgba(src_y, src_uv, _dst0, src_y.rows, src_y.cols); } template void xFNv212Yuv4(xf::cv::Mat& src_y, xf::cv::Mat