Merge pull request #186 from EthicalML/transfer_hpp_to_cpp

Resolve moving all functions from tensor HPP to CPP
KomputeProject · Mar 13, 2021 · 42ba714 · 42ba714
2 parents 00f02cb + 7d2c782
commit 42ba714
Show file tree

Hide file tree

Showing 6 changed files with 277 additions and 232 deletions.
diff --git a/single_include/kompute/Kompute.hpp b/single_include/kompute/Kompute.hpp
@@ -910,35 +910,39 @@ class Tensor
     void recordCopyFromDeviceToStaging(const vk::CommandBuffer& commandBuffer);
 
     /**
-     * Records the buffer memory barrier into the primary buffer and command buffer which
-     * ensures that relevant data transfers are carried out correctly.
+     * Records the buffer memory barrier into the primary buffer and command
+     * buffer which ensures that relevant data transfers are carried out
+     * correctly.
      *
      * @param commandBuffer Vulkan Command Buffer to record the commands into
      * @param srcAccessMask Access flags for source access mask
      * @param dstAccessMask Access flags for destination access mask
      * @param scrStageMask Pipeline stage flags for source stage mask
      * @param dstStageMask Pipeline stage flags for destination stage mask
      */
-    void recordPrimaryBufferMemoryBarrier(const vk::CommandBuffer& commandBuffer,
-                                          vk::AccessFlagBits srcAccessMask,
-                                          vk::AccessFlagBits dstAccessMask,
-                                          vk::PipelineStageFlagBits srcStageMask,
-                                          vk::PipelineStageFlagBits dstStageMask);
+    void recordPrimaryBufferMemoryBarrier(
+      const vk::CommandBuffer& commandBuffer,
+      vk::AccessFlagBits srcAccessMask,
+      vk::AccessFlagBits dstAccessMask,
+      vk::PipelineStageFlagBits srcStageMask,
+      vk::PipelineStageFlagBits dstStageMask);
     /**
-     * Records the buffer memory barrier into the staging buffer and command buffer which
-     * ensures that relevant data transfers are carried out correctly.
+     * Records the buffer memory barrier into the staging buffer and command
+     * buffer which ensures that relevant data transfers are carried out
+     * correctly.
      *
      * @param commandBuffer Vulkan Command Buffer to record the commands into
      * @param srcAccessMask Access flags for source access mask
      * @param dstAccessMask Access flags for destination access mask
      * @param scrStageMask Pipeline stage flags for source stage mask
      * @param dstStageMask Pipeline stage flags for destination stage mask
      */
-    void recordStagingBufferMemoryBarrier(const vk::CommandBuffer& commandBuffer,
-                                          vk::AccessFlagBits srcAccessMask,
-                                          vk::AccessFlagBits dstAccessMask,
-                                          vk::PipelineStageFlagBits srcStageMask,
-                                          vk::PipelineStageFlagBits dstStageMask);
+    void recordStagingBufferMemoryBarrier(
+      const vk::CommandBuffer& commandBuffer,
+      vk::AccessFlagBits srcAccessMask,
+      vk::AccessFlagBits dstAccessMask,
+      vk::PipelineStageFlagBits srcStageMask,
+      vk::PipelineStageFlagBits dstStageMask);
 
     /**
      * Constructs a vulkan descriptor buffer info which can be used to specify
@@ -955,47 +959,74 @@ class Tensor
      *
      * @return Unsigned integer representing the total number of elements
      */
-    // TODO: move to cpp
-    uint32_t size() { return this->mSize; }
+    uint32_t size();
 
-    // TODO: move to cpp
-    uint32_t dataTypeMemorySize() { return this->mDataTypeMemorySize; }
+    /**
+     * Returns the total size of a single element of the respective data type
+     * that this tensor holds.
+     *
+     * @return Unsigned integer representing the memory of a single element of
+     * the respective data type.
+     */
+    uint32_t dataTypeMemorySize();
 
-    // TODO: move to cpp
-    uint32_t memorySize() { return this->mSize * this->mDataTypeMemorySize; }
+    /**
+     * Returns the total memory size of the data contained by the Tensor object
+     * which would equate to (this->size() * this->dataTypeMemorySize())
+     *
+     * @return Unsigned integer representing the memory of a single element of
+     * the respective data type.
+     */
+    uint32_t memorySize();
 
     /**
-     * Retrieve the underlying data type of the Tensor
+     * Retrieve the data type of the tensor (host, device, storage)
      *
      * @return Data type of tensor of type kp::Tensor::TensorDataTypes
      */
-    TensorDataTypes dataType() { return this->mDataType; }
+    TensorDataTypes dataType();
 
-    void* rawData() { return this->mRawData; }
+    /**
+     * Retrieve the raw data via the pointer to the memory that contains the raw
+     * memory of this current tensor. This tensor gets changed to a nullptr when
+     * the Tensor is removed.
+     *
+     * @return Pointer to raw memory containing raw bytes data of Tensor.
+     */
+    void* rawData();
 
-    // TODO: move to cpp
+    /**
+     * Sets / resets the data of the tensor which is directly done on the GPU
+     * host visible memory available by the tensor.
+     */
+    void setRawData(const void* data);
+
+    /**
+     * Template to return the pointer data converted by specific type, which
+     * would be any of the supported types including float, double, int32,
+     * uint32 and bool.
+     *
+     * @return Pointer to raw memory containing raw bytes data of Tensor.
+     */
     template<typename T>
     T* data()
     {
         return (T*)this->mRawData;
     }
 
+    /**
+     * Template to get the data of the current tensor as a vector of specific
+     * type, which would be any of the supported types including float, double,
+     * int32, uint32 and bool.
+     *
+     * @return Vector of type provided by template.
+     */
     template<typename T>
     std::vector<T> vector()
     {
         return { (T*)this->mRawData, ((T*)this->mRawData) + this->size() };
     }
 
-    /**
-     * Sets / resets the vector data of the tensor. This function does not
-     * perform any copies into GPU memory and is only performed on the host.
-     */
-    void setRawData(const void* data)
-    {
-        // Copy data
-        memcpy(this->mRawData, data, this->memorySize());
-    }
-
   protected:
     // -------------- ALWAYS OWNED RESOURCES
     TensorTypes mTensorType;
@@ -1005,57 +1036,6 @@ class Tensor
     void* mRawData;
 
   private:
-    void mapRawData()
-    {
-
-        KP_LOG_DEBUG("Kompute Tensor mapping data from host buffer");
-
-        std::shared_ptr<vk::DeviceMemory> hostVisibleMemory = nullptr;
-
-        if (this->mTensorType == TensorTypes::eHost) {
-            hostVisibleMemory = this->mPrimaryMemory;
-        } else if (this->mTensorType == TensorTypes::eDevice) {
-            hostVisibleMemory = this->mStagingMemory;
-        } else {
-            KP_LOG_WARN(
-              "Kompute Tensor mapping data not supported on storage tensor");
-            return;
-        }
-
-        vk::DeviceSize bufferSize = this->memorySize();
-
-        // Given we request coherent host memory we don't need to invalidate /
-        // flush
-        this->mRawData = this->mDevice->mapMemory(
-          *hostVisibleMemory, 0, bufferSize, vk::MemoryMapFlags());
-
-        vk::MappedMemoryRange mappedMemoryRange(
-          *hostVisibleMemory, 0, bufferSize);
-    }
-
-    void unmapRawData()
-    {
-
-        KP_LOG_DEBUG("Kompute Tensor mapping data from host buffer");
-
-        std::shared_ptr<vk::DeviceMemory> hostVisibleMemory = nullptr;
-
-        if (this->mTensorType == TensorTypes::eHost) {
-            hostVisibleMemory = this->mPrimaryMemory;
-        } else if (this->mTensorType == TensorTypes::eDevice) {
-            hostVisibleMemory = this->mStagingMemory;
-        } else {
-            KP_LOG_WARN(
-              "Kompute Tensor mapping data not supported on storage tensor");
-            return;
-        }
-
-        vk::DeviceSize bufferSize = this->memorySize();
-        vk::MappedMemoryRange mappedRange(*hostVisibleMemory, 0, bufferSize);
-        this->mDevice->flushMappedMemoryRanges(1, &mappedRange);
-        this->mDevice->unmapMemory(*hostVisibleMemory);
-    }
-
     // -------------- NEVER OWNED RESOURCES
     std::shared_ptr<vk::PhysicalDevice> mPhysicalDevice;
     std::shared_ptr<vk::Device> mDevice;
@@ -1093,9 +1073,11 @@ class Tensor
     vk::MemoryPropertyFlags getPrimaryMemoryPropertyFlags();
     vk::BufferUsageFlags getStagingBufferUsageFlags();
     vk::MemoryPropertyFlags getStagingMemoryPropertyFlags();
+
+    void mapRawData();
+    void unmapRawData();
 };
 
-// TODO: Limit T to be only float, bool, double, etc
 template<typename T>
 class TensorT : public Tensor
 {

diff --git a/src/OpMemoryBarrier.cpp b/src/OpMemoryBarrier.cpp
@@ -5,21 +5,20 @@
 namespace kp {
 
 OpMemoryBarrier::OpMemoryBarrier(
-            const std::vector<std::shared_ptr<Tensor>>& tensors,
-            const vk::AccessFlagBits& srcAccessMask,
-            const vk::AccessFlagBits& dstAccessMask,
-            const vk::PipelineStageFlagBits& srcStageMask,
-            const vk::PipelineStageFlagBits& dstStageMask,
-            bool barrierOnPrimary)
-    : mTensors(tensors),
-      mSrcAccessMask(srcAccessMask),
-      mDstAccessMask(dstAccessMask),
-      mSrcStageMask(srcStageMask),
-      mDstStageMask(dstStageMask),
-      mBarrierOnPrimary(barrierOnPrimary)
+  const std::vector<std::shared_ptr<Tensor>>& tensors,
+  const vk::AccessFlagBits& srcAccessMask,
+  const vk::AccessFlagBits& dstAccessMask,
+  const vk::PipelineStageFlagBits& srcStageMask,
+  const vk::PipelineStageFlagBits& dstStageMask,
+  bool barrierOnPrimary)
+  : mTensors(tensors)
+  , mSrcAccessMask(srcAccessMask)
+  , mDstAccessMask(dstAccessMask)
+  , mSrcStageMask(srcStageMask)
+  , mDstStageMask(dstStageMask)
+  , mBarrierOnPrimary(barrierOnPrimary)
 {
     KP_LOG_DEBUG("Kompute OpMemoryBarrier constructor");
-
 }
 
 OpMemoryBarrier::~OpMemoryBarrier()
@@ -35,21 +34,19 @@ OpMemoryBarrier::record(const vk::CommandBuffer& commandBuffer)
     // Barrier to ensure the data is finished writing to buffer memory
     if (this->mBarrierOnPrimary) {
         for (const std::shared_ptr<Tensor>& tensor : this->mTensors) {
-            tensor->recordPrimaryBufferMemoryBarrier(
-              commandBuffer,
-              this->mSrcAccessMask,
-              this->mDstAccessMask,
-              this->mSrcStageMask,
-              this->mDstStageMask);
+            tensor->recordPrimaryBufferMemoryBarrier(commandBuffer,
+                                                     this->mSrcAccessMask,
+                                                     this->mDstAccessMask,
+                                                     this->mSrcStageMask,
+                                                     this->mDstStageMask);
         }
     } else {
         for (const std::shared_ptr<Tensor>& tensor : this->mTensors) {
-            tensor->recordStagingBufferMemoryBarrier(
-              commandBuffer,
-              this->mSrcAccessMask,
-              this->mDstAccessMask,
-              this->mSrcStageMask,
-              this->mDstStageMask);
+            tensor->recordStagingBufferMemoryBarrier(commandBuffer,
+                                                     this->mSrcAccessMask,
+                                                     this->mDstAccessMask,
+                                                     this->mSrcStageMask,
+                                                     this->mDstStageMask);
         }
     }
 }

diff --git a/src/OpTensorCopy.cpp b/src/OpTensorCopy.cpp
@@ -44,8 +44,7 @@ OpTensorCopy::record(const vk::CommandBuffer& commandBuffer)
 
     // We iterate from the second tensor onwards and record a copy to all
     for (size_t i = 1; i < this->mTensors.size(); i++) {
-        this->mTensors[i]->recordCopyFrom(
-          commandBuffer, this->mTensors[0]);
+        this->mTensors[i]->recordCopyFrom(commandBuffer, this->mTensors[0]);
     }
 }
 
@@ -60,10 +59,6 @@ OpTensorCopy::postEval(const vk::CommandBuffer& commandBuffer)
 {
     KP_LOG_DEBUG("Kompute OpTensorCopy postEval called");
 
-    // TODO: Simplify with a copyRawData
-    uint32_t size = this->mTensors[0]->size();
-    uint32_t dataTypeMemSize = this->mTensors[0]->dataTypeMemorySize();
-    uint32_t memSize = size * dataTypeMemSize;
     void* data = this->mTensors[0]->rawData();
 
     // Copy the data from the first tensor into all the tensors

diff --git a/src/OpTensorSyncLocal.cpp b/src/OpTensorSyncLocal.cpp
@@ -31,19 +31,21 @@ OpTensorSyncLocal::record(const vk::CommandBuffer& commandBuffer)
     for (size_t i = 0; i < this->mTensors.size(); i++) {
         if (this->mTensors[i]->tensorType() == Tensor::TensorTypes::eDevice) {
 
-            this->mTensors[i]->recordPrimaryBufferMemoryBarrier(commandBuffer,
-                                        vk::AccessFlagBits::eShaderWrite,
-                                        vk::AccessFlagBits::eTransferRead,
-                                        vk::PipelineStageFlagBits::eComputeShader,
-                                        vk::PipelineStageFlagBits::eTransfer);
+            this->mTensors[i]->recordPrimaryBufferMemoryBarrier(
+              commandBuffer,
+              vk::AccessFlagBits::eShaderWrite,
+              vk::AccessFlagBits::eTransferRead,
+              vk::PipelineStageFlagBits::eComputeShader,
+              vk::PipelineStageFlagBits::eTransfer);
 
             this->mTensors[i]->recordCopyFromDeviceToStaging(commandBuffer);
 
-            this->mTensors[i]->recordPrimaryBufferMemoryBarrier(commandBuffer,
-                                        vk::AccessFlagBits::eTransferWrite,
-                                        vk::AccessFlagBits::eHostRead,
-                                        vk::PipelineStageFlagBits::eTransfer,
-                                        vk::PipelineStageFlagBits::eHost);
+            this->mTensors[i]->recordPrimaryBufferMemoryBarrier(
+              commandBuffer,
+              vk::AccessFlagBits::eTransferWrite,
+              vk::AccessFlagBits::eHostRead,
+              vk::PipelineStageFlagBits::eTransfer,
+              vk::PipelineStageFlagBits::eHost);
         }
     }
 }