pytorch
diff --git a/‎.circleci/config.yml‎
Lines changed: 1 addition & 1 deletion b/‎.circleci/config.yml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎.circleci/ecr_gc_docker/gc.py‎
Lines changed: 69 additions & 4 deletions b/‎.circleci/ecr_gc_docker/gc.py‎
Lines changed: 69 additions & 4 deletions
diff --git a/‎.circleci/verbatim-sources/docker_jobs.yml‎
Lines changed: 1 addition & 1 deletion b/‎.circleci/verbatim-sources/docker_jobs.yml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎aten/src/ATen/core/jit_type.h‎
Lines changed: 14 additions & 3 deletions b/‎aten/src/ATen/core/jit_type.h‎
Lines changed: 14 additions & 3 deletions
diff --git a/‎aten/src/ATen/native/Activation.cpp‎
Lines changed: 46 additions & 0 deletions b/‎aten/src/ATen/native/Activation.cpp‎
Lines changed: 46 additions & 0 deletions
diff --git a/‎aten/src/ATen/native/Activation.h‎
Lines changed: 4 additions & 0 deletions b/‎aten/src/ATen/native/Activation.h‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎aten/src/ATen/native/Loss.cpp‎
Lines changed: 40 additions & 0 deletions b/‎aten/src/ATen/native/Loss.cpp‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎aten/src/ATen/native/cpu/Activation.cpp‎
Lines changed: 42 additions & 1 deletion b/‎aten/src/ATen/native/cpu/Activation.cpp‎
Lines changed: 42 additions & 1 deletion
diff --git a/‎aten/src/ATen/native/cuda/Activation.cu‎
Lines changed: 20 additions & 0 deletions b/‎aten/src/ATen/native/cuda/Activation.cu‎
Lines changed: 20 additions & 0 deletions
@@ -1640,7 +1640,7 @@ jobs:
               set +x
               export AWS_ACCESS_KEY_ID=${CIRCLECI_AWS_ACCESS_KEY_FOR_DOCKER_BUILDER_V1}
               export AWS_SECRET_ACCESS_KEY=${CIRCLECI_AWS_SECRET_KEY_FOR_DOCKER_BUILDER_V1}
-              eval $(aws ecr get-login --no-include-email)
+              eval $(aws ecr get-login --no-include-email --region us-east-1)
               set -x
               docker push 308535385114.dkr.ecr.us-east-1.amazonaws.com/gc/ecr
   ecr_gc_job:
 
@@ -7,6 +7,60 @@
 import sys
 
 
+def save_to_s3(project, data):
+    table_content = ""
+    client = boto3.client("s3")
+    for repo, tag, window, age, pushed in data:
+        table_content += f"<tr><td>{repo}</td><td>{tag}</td><td>{window}</td><td>{age}</td><td>{pushed}</td></tr>"
+    html_body = f"""
+    <html>
+        <head>
+            <link rel="stylesheet"
+                href="https://stackpath.bootstrapcdn.com/bootstrap/4.4.1/css/bootstrap.min.css"
+                integrity="sha384-Vkoo8x4CGsO3+Hhxv8T/Q5PaXtkKtu6ug5TOeNV6gBiFeWPGFN9MuhOf23Q9Ifjh"
+                crossorigin="anonymous">
+            <link rel="stylesheet" type="text/css" href="https://cdn.datatables.net/1.10.20/css/jquery.dataTables.css">
+            <script src="https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js"></script>
+            <script type="text/javascript" charset="utf8" src="https://cdn.datatables.net/1.10.20/js/jquery.dataTables.js"></script>
+            <title>{project} nightly and permanent docker image info</title>
+        </head>
+        <body>
+            <table class="table table-striped table-hover" id="docker">
+            <thead class="thead-dark">
+                <tr>
+                <th scope="col">repo</th>
+                <th scope="col">tag</th>
+                <th scope="col">keep window</th>
+                <th scope="col">age</th>
+                <th scope="col">pushed at</th>
+                </tr>
+            </thead>
+            <tbody>
+                {table_content}
+            </tbody>
+            </table>
+        </body>
+        <script>
+            $(document).ready( function () {{
+                $('#docker').DataTable({{paging: false}});
+            }} );
+        </script>
+    </html>
+    """
+
+    # for pytorch, file can be found at
+    # http://ossci-docker.s3-website.us-east-1.amazonaws.com/pytorch.html
+    # and later one we can config docker.pytorch.org to point to the location
+
+    client.put_object(
+        Bucket="ossci-docker",
+        ACL="public-read",
+        Key=f"{project}.html",
+        Body=html_body,
+        ContentType="text/html",
+    )
+
+
 def repos(client):
     paginator = client.get_paginator("describe_repositories")
     pages = paginator.paginate(registryId="308535385114")
@@ -89,29 +143,38 @@ def chunks(chunkable, n):
         yield chunkable[i : i + n]
 
 
+stable_window_tags = []
 for repo in repos(client):
     repositoryName = repo["repositoryName"]
     if not repositoryName.startswith(args.filter_prefix):
         continue
 
     # Keep list of image digests to delete for this repository
     digest_to_delete = []
-
     print(repositoryName)
+
     for image in images(client, repo):
         tags = image.get("imageTags")
         if not isinstance(tags, (list,)) or len(tags) == 0:
             continue
 
         tag = tags[0]
+        created = image["imagePushedAt"]
+        age = now - created
         # new images build on circle ci use workflow ID as tag, which has 4 "-"
-        if tag.isdigit() or tag.count("-") == 4:
+        if tag.isdigit() or tag.count("-") == 4 or tag in ignore_tags:
             window = stable_window
+            if tag in ignore_tags:
+                stable_window_tags.append((repositoryName, tag, "", age, created))
+            elif age < window:
+                stable_window_tags.append((repositoryName, tag, window, age, created))
         else:
             window = unstable_window
 
-        created = image["imagePushedAt"].replace(tzinfo=pytz.UTC)
-        age = now - created
+        print(
+            f"Debug: for tag: {tag}, keep window is {window}, age is {age}, pushed at {image['imagePushedAt']}"
+        )
+
         if tag in ignore_tags:
             print("Ignoring tag {} (age: {})".format(tag, age))
             continue
@@ -135,3 +198,5 @@ def chunks(chunkable, n):
             repositoryName=repositoryName,
             imageIds=[{"imageDigest": digest} for digest in c],
         )
+
+    save_to_s3(args.filter_prefix, stable_window_tags)
@@ -33,7 +33,7 @@
               set +x
               export AWS_ACCESS_KEY_ID=${CIRCLECI_AWS_ACCESS_KEY_FOR_DOCKER_BUILDER_V1}
               export AWS_SECRET_ACCESS_KEY=${CIRCLECI_AWS_SECRET_KEY_FOR_DOCKER_BUILDER_V1}
-              eval $(aws ecr get-login --no-include-email)
+              eval $(aws ecr get-login --no-include-email --region us-east-1)
               set -x
               docker push 308535385114.dkr.ecr.us-east-1.amazonaws.com/gc/ecr
   ecr_gc_job:
 
@@ -1435,8 +1435,8 @@ struct CAFFE2_API ClassType : public NamedType {
 
   const std::vector<Function*>& methods() const;
 
-  TypePtr getAttribute(const std::string& name) const {
-    AT_ASSERT(attributeNames_.size() == attributeTypes_.size());
+  TypePtr findAttribute(const std::string& name) const {
+    TORCH_INTERNAL_ASSERT(attributeNames_.size() == attributeTypes_.size());
     size_t pos = 0;
     for (const auto& attr : attributeNames_) {
       if (name == attr) {
@@ -1451,6 +1451,17 @@ struct CAFFE2_API ClassType : public NamedType {
     return attributeTypes_[pos];
   }
 
+  TypePtr getAttribute(const std::string& name) const {
+    auto type = findAttribute(name);
+    TORCH_CHECK(
+        type,
+        python_str(),
+        " does not have an attribute with name '",
+        name,
+        "'");
+    return type;
+  }
+
   size_t numAttributes() const {
     AT_ASSERT(attributeNames_.size() == attributeTypes_.size());
     return attributeNames_.size();
@@ -1491,7 +1502,7 @@ struct CAFFE2_API ClassType : public NamedType {
     TORCH_CHECK(
         false,
         python_str(),
-        " does not have a field with the name '",
+        " does not have an attribute with name '",
         name,
         "'");
   }
 
@@ -20,6 +20,8 @@ DEFINE_DISPATCH(hardtanh_backward_stub);
 DEFINE_DISPATCH(hardshrink_stub);
 DEFINE_DISPATCH(softshrink_stub);
 DEFINE_DISPATCH(shrink_backward_stub);
+DEFINE_DISPATCH(leaky_relu_stub);
+DEFINE_DISPATCH(leaky_relu_backward_stub);
 
 Tensor hardtanh(const Tensor& self, Scalar min, Scalar max) {
   return at::clamp(self, min, max);
@@ -475,6 +477,50 @@ Tensor gelu_backward_cpu(const Tensor& grad, const Tensor& self) {
   return dX;
 }
 
+Tensor& leaky_relu_out(
+    Tensor& result,
+    const Tensor& self,
+    Scalar negval) {
+  auto iter = TensorIterator::unary_op(result, self);
+  leaky_relu_stub(iter.device_type(), iter, negval);
+  return result;
+}
+
+Tensor leaky_relu(
+    const Tensor& self,
+    Scalar negval) {
+  Tensor result;
+  auto iter = TensorIterator::unary_op(result, self);
+  leaky_relu_stub(iter.device_type(), iter, negval);
+  return iter.output();
+}
+
+Tensor & leaky_relu_(
+    Tensor & self,
+    Scalar neg_val) {
+  return at::leaky_relu_out(self, self, neg_val);
+}
+
+Tensor& leaky_relu_backward_out(
+    Tensor& grad_input,
+    const Tensor& grad_output,
+    const Tensor& input,
+    Scalar negval) {
+  auto iter = TensorIterator::binary_op(grad_input, input, grad_output);
+  leaky_relu_backward_stub(iter.device_type(), iter, negval);
+  return grad_input;
+}
+
+Tensor leaky_relu_backward(
+    const Tensor& grad_output,
+    const Tensor& input,
+    Scalar negval) {
+  Tensor result;
+  auto iter = TensorIterator::binary_op(result, input, grad_output);
+  leaky_relu_backward_stub(iter.device_type(), iter, negval);
+  return iter.output();
+}
+
 DEFINE_DISPATCH(GeluKernel);
 DEFINE_DISPATCH(GeluBackwardKernel);
 
 
@@ -17,6 +17,8 @@ using hardtanh_backward_fn = void (*)(TensorIterator&, Scalar, Scalar);
 using shrink_fn = void (*)(TensorIterator&, Scalar);
 using shrink_backward_fn = void (*)(TensorIterator&, Scalar);
 using elu_fn = void (*)(TensorIterator&, Scalar, Scalar, Scalar);
+using leaky_relu_fn = void (*)(TensorIterator&, Scalar);
+using leaky_relu_backward_fn = void (*)(TensorIterator&, Scalar);
 
 DECLARE_DISPATCH(elu_fn, elu_stub);
 DECLARE_DISPATCH(elu_fn, elu_backward_stub);
@@ -27,6 +29,8 @@ DECLARE_DISPATCH(hardtanh_backward_fn, hardtanh_backward_stub);
 DECLARE_DISPATCH(shrink_fn, hardshrink_stub);
 DECLARE_DISPATCH(shrink_fn, softshrink_stub);
 DECLARE_DISPATCH(shrink_backward_fn, shrink_backward_stub);
+DECLARE_DISPATCH(leaky_relu_fn, leaky_relu_stub);
+DECLARE_DISPATCH(leaky_relu_backward_fn, leaky_relu_backward_stub);
 
 } // namespace native
 
 
@@ -159,6 +159,46 @@ Tensor poisson_nll_loss(const Tensor& input, const Tensor& target, const bool lo
     return apply_loss_reduction(loss, reduction);
 }
 
+Tensor& soft_margin_loss_backward_out(Tensor& grad_input, const Tensor& grad_output, const Tensor& input, const Tensor& target, int64_t reduction) {
+  auto norm = reduction == Reduction::Mean ? 1. / input.numel() : 1.;
+  auto z = at::exp(-target * input);
+  // inplace version of: grad_input = -norm * target * z / (1. + z) * grad_output;
+  at::mul_out(grad_input, target, z).mul_(-norm);
+  z.add_(1);
+  grad_input.div_(z).mul_(grad_output);
+  return grad_input;
+}
+
+Tensor soft_margin_loss_backward(const Tensor& grad_output, const Tensor& input, const Tensor& target, int64_t reduction) {
+  auto grad_input = at::empty({0}, input.options());
+  at::soft_margin_loss_backward_out(grad_input, grad_output, input, target, reduction);
+  return grad_input;
+}
+
+Tensor& soft_margin_loss_out(
+    Tensor& output,
+    const Tensor& input,
+    const Tensor& target,
+    int64_t reduction) {
+  // compute inplace variant of: output = at::log(1. + at::exp(-input * target));
+  at::neg_out(output, input).mul_(target).exp_().add_(1.).log_();
+  if (reduction != Reduction::None) {
+    auto tmp = apply_loss_reduction(output, reduction);
+    output.resize_({});
+    output.copy_(tmp);
+  }
+  return output;
+}
+
+Tensor soft_margin_loss(
+    const Tensor& input,
+    const Tensor& target,
+    int64_t reduction) {
+  auto output = at::empty({0}, input.options());
+  at::soft_margin_loss_out(output, input, target, reduction);
+  return output;
+}
+
 Tensor smooth_l1_loss(const Tensor& input, const Tensor& target, const int64_t reduction) {
   Tensor loss;
   auto iter = TensorIterator::binary_op(loss, input, target);
 
@@ -235,7 +235,7 @@ void hardshrink_kernel(TensorIterator& iter, Scalar lambd) {
 }
 
 void softshrink_kernel(TensorIterator& iter, Scalar lambd) {
-  AT_DISPATCH_FLOATING_TYPES_AND_HALF(iter.dtype(), "softshrink_cuda", [&]() {
+  AT_DISPATCH_FLOATING_TYPES_AND_HALF(iter.dtype(), "softshrink_cpu", [&]() {
     auto lambd_val = lambd.to<scalar_t>();
     cpu_kernel(iter, [=](scalar_t a) -> scalar_t {
       return a > lambd_val ? a - lambd_val : (a < -lambd_val ? a + lambd_val : scalar_t(0));
@@ -272,6 +272,45 @@ void hardtanh_backward_kernel(TensorIterator& iter, Scalar min, Scalar max) {
         });
   });
 }
+
+static void leaky_relu_kernel(TensorIterator& iter, Scalar negval_) {
+  AT_DISPATCH_FLOATING_TYPES(iter.dtype(), "leaky_relu_cpu", [&] {
+    using Vec = Vec256<scalar_t>;
+    auto zero_vec = Vec((scalar_t)(0));
+    auto one_vec = Vec((scalar_t)(1));
+    scalar_t negval = negval_.to<scalar_t>();
+    Vec negval_v = Vec(negval);
+    cpu_kernel_vec(
+        iter,
+        [&](scalar_t a) -> scalar_t {
+          return a > scalar_t(0) ? a : a * negval;
+        },
+        [&](Vec a) -> Vec {
+          auto r = Vec::blendv(negval_v, one_vec, a > zero_vec);
+          return a * r;
+        });
+  });
+}
+
+static void leaky_relu_backward_kernel(TensorIterator& iter, Scalar negval_) {
+  AT_DISPATCH_FLOATING_TYPES(iter.dtype(), "leaky_relu_backward_cpu", [&] {
+    using Vec = Vec256<scalar_t>;
+    auto zero_vec = Vec((scalar_t)(0));
+    auto one_vec = Vec((scalar_t)(1));
+    scalar_t negval = negval_.to<scalar_t>();
+    Vec negval_v = Vec(negval);
+    cpu_kernel_vec(
+        iter,
+        [&](scalar_t a, scalar_t b) -> scalar_t {
+          return a > scalar_t(0) ? b : b * negval;
+        },
+        [&](Vec a, Vec b) -> Vec {
+          auto r = Vec::blendv(negval_v, one_vec, a > zero_vec);
+          return b * r;
+        });
+  });
+}
+
 } // namespace
 
 REGISTER_DISPATCH(threshold_stub, &threshold_kernel);
@@ -283,6 +322,8 @@ REGISTER_DISPATCH(hardtanh_backward_stub, &hardtanh_backward_kernel);
 REGISTER_DISPATCH(hardshrink_stub, &hardshrink_kernel);
 REGISTER_DISPATCH(softshrink_stub, &softshrink_kernel);
 REGISTER_DISPATCH(shrink_backward_stub, &shrink_backward_kernel);
+REGISTER_DISPATCH(leaky_relu_stub, &leaky_relu_kernel);
+REGISTER_DISPATCH(leaky_relu_backward_stub, &leaky_relu_backward_kernel);
 
 } // namespace native
 } // namespace at
@@ -344,6 +344,24 @@ void GeluBackwardCUDAKernelImpl(TensorIterator& it) {
       });
 }
 
+void leaky_relu_kernel(TensorIterator& iter, Scalar negval_) {
+  AT_DISPATCH_FLOATING_TYPES_AND_HALF(iter.dtype(), "leaky_relu_cuda", [&]() {
+    auto negval = negval_.to<scalar_t>();
+    gpu_kernel(iter, [negval]GPU_LAMBDA(scalar_t a) -> scalar_t {
+      return a > scalar_t(0) ? a : a * negval;
+    });
+  });
+}
+
+void leaky_relu_backward_kernel(TensorIterator& iter, Scalar negval_) {
+  AT_DISPATCH_FLOATING_TYPES_AND_HALF(iter.dtype(), "leaky_relu_backward_cuda", [&]() {
+    auto negval = negval_.to<scalar_t>();
+    gpu_kernel(iter, [negval]GPU_LAMBDA(scalar_t a, scalar_t b) -> scalar_t {
+      return a > scalar_t(0) ? b : b * negval;
+    });
+  });
+}
+
 } // namespace
 
 Tensor gelu_cuda(const Tensor& self) {
@@ -398,5 +416,7 @@ REGISTER_DISPATCH(softshrink_stub, &softshrink_kernel);
 REGISTER_DISPATCH(shrink_backward_stub, &shrink_backward_kernel);
 REGISTER_DISPATCH(elu_stub, &elu_kernel);
 REGISTER_DISPATCH(elu_backward_stub, &elu_backward_kernel);
+REGISTER_DISPATCH(leaky_relu_stub, &leaky_relu_kernel);
+REGISTER_DISPATCH(leaky_relu_backward_stub, &leaky_relu_backward_kernel);
 
 }}  // namespace at::native