Add support for Bfloat16 to use vector instructions on Altivec

architecture
2026-04-10 11:34:33 +08:00 · 2020-06-24 15:27:26 -05:00
parent 46f8a18567
commit 704798d1df
2 changed files with 457 additions and 5 deletions
--- a/test/packetmath.cpp
+++ b/test/packetmath.cpp
@@ -247,6 +247,20 @@ void packetmath_boolean_mask_ops() {
    data1[i + PacketSize] = internal::random<bool>() ? data1[i] : Scalar(0);
  }
  CHECK_CWISE2_IF(true, internal::pcmp_eq, internal::pcmp_eq);
+
+  //Test (-0) == (0) for signed operations
+  for (int i = 0; i < PacketSize; ++i) {
+    data1[i] = Scalar(-0.0);
+    data1[i + PacketSize] = internal::random<bool>() ? data1[i] : Scalar(0);
+  }
+  CHECK_CWISE2_IF(true, internal::pcmp_eq, internal::pcmp_eq);
+
+  //Test NaN
+  for (int i = 0; i < PacketSize; ++i) {
+    data1[i] = std::numeric_limits<Scalar>::quiet_NaN();
+    data1[i + PacketSize] = internal::random<bool>() ? data1[i] : Scalar(0);
+  }
+  CHECK_CWISE2_IF(true, internal::pcmp_eq, internal::pcmp_eq);
 }

 // Packet16b representing bool does not support ptrue, pandnot or pcmp_eq, since the scalar path
@@ -254,6 +268,22 @@ void packetmath_boolean_mask_ops() {
 template<>
 void packetmath_boolean_mask_ops<bool, internal::packet_traits<bool>::type>() {}

+template <typename Scalar, typename Packet>
+void packetmath_minus_zero_add() {
+  const int PacketSize = internal::unpacket_traits<Packet>::size;
+  const int size = 2 * PacketSize;
+  EIGEN_ALIGN_MAX Scalar data1[size];
+  EIGEN_ALIGN_MAX Scalar data2[size];
+  EIGEN_ALIGN_MAX Scalar ref[size];
+
+  for (int i = 0; i < PacketSize; ++i) {
+    data1[i] = Scalar(-0.0);
+    data1[i + PacketSize] = Scalar(-0.0);
+  }
+  CHECK_CWISE2_IF(internal::packet_traits<Scalar>::HasAdd, REF_ADD, internal::padd);
+}
+
+
 template <typename Scalar, typename Packet>
 void packetmath() {
  typedef internal::packet_traits<Scalar> PacketTraits;
@@ -454,6 +484,7 @@ void packetmath() {

  packetmath_boolean_mask_ops<Scalar, Packet>();
  packetmath_pcast_ops_runner<Scalar, Packet>::run();
+  packetmath_minus_zero_add<Scalar, Packet>();
 }

 template <typename Scalar, typename Packet>