jupyter-widgets · jasongrout · Mar 21, 2017 · Mar 8, 2017 · Mar 8, 2017 · Mar 9, 2017
diff --git a/ipywidgets/widgets/tests/test_traits.py b/ipywidgets/widgets/tests/test_traits.py
@@ -2,11 +2,13 @@
 # Distributed under the terms of the Modified BSD License.
 
 """Test trait types of the widget packages."""
+import array
 
 from unittest import TestCase
 from traitlets import HasTraits
 from traitlets.tests.test_traitlets import TraitTestBase
 from ipywidgets import Color
+from ipywidgets.widgets.widget import _split_state_buffers
 
 
 class ColorTrait(HasTraits):
@@ -19,3 +21,19 @@ class TestColor(TraitTestBase):
     _good_values = ["blue", "#AA0", "#FFFFFF"]
     _bad_values = ["vanilla", "blues"]
 
+
+class TestBuffers(TestCase):
+    def test_state_with_buffers(self):
+        mv1 =  memoryview(b'test1')
+        mv2 =  memoryview(b'test2')
+        state = {'plain': [0, 'text'], 'x': {'ar': mv1}, 'y': {'shape': (10, 10), 'data': mv1}, 'z': [mv1, mv2], 'top': mv1}
+        state, state_with_buffers, buffer_paths, buffers = _split_state_buffers(state)
+        print("executed", state, state_with_buffers, buffer_paths, buffers)
+        self.assertIn('plain', state)
+        self.assertNotIn('x', state)
+        self.assertNotIn('y', state)
+        self.assertNotIn('z', state)
+        for path, buffer in [(['x', 'ar'], mv1), (['y', 'data'], mv1), (['z', 0], mv1), (['z', 1], mv2), (['top'], mv1)]:
+            self.assertIn(path, buffer_paths, "%r not in path" % path)
+            index = buffer_paths.index(path)
+            self.assertEqual(buffer, buffers[index])
diff --git a/ipywidgets/widgets/widget.py b/ipywidgets/widgets/widget.py
@@ -50,6 +50,55 @@ def _json_to_widget(x, obj):
 else:
     _binary_types = (memoryview, buffer)
 
+
+def _split_state_buffers(state):
+    """Return (state_without_buffers, state_with_buffers, buffer_paths, buffers) for binary message parts
+
+    state_with_buffers is a dict where any of it's decendents is is a binary_type.
+
+    As an example:
+    >>> state = {'plain': [0, 'text'], 'x': {'ar': memoryview(ar1)}, 'y': {'shape': (10,10), 'data': memoryview(ar2)}}
+    >>> widget._split_state_buffers(state)
+    ({'plain': [0, 'text']}, {'x': {}, 'y': {'shape': (10, 10)}}, [['x', 'ar'], ['y', 'data']],
+     [<memory at 0x107ffec48>, <memory at 0x107ffed08>])
+    """
+
+    def seperate_buffers(substate, path, buffer_paths, buffers):
+        # remove binary types from dicts and lists, and keep there key, e.g. {'x': {'ar': ar}, 'y': [ar2, ar3]}
+        # where are ar* are binary types
+        # will result in {'x': {}, 'y': [None, None]}, [ar, ar2, ar3], [['x', 'ar'], ['y', 0], ['y', 1]]
+        # instead of removing elements from the list, this will make replacing the buffers on the js side much easier
+        if isinstance(substate, (list, tuple)):
+            for i, v in enumerate(substate):
+                if isinstance(v, (dict, list, tuple)):
+                    seperate_buffers(v, path + [i], buffer_paths, buffers)
+                if isinstance(v, _binary_types):
+                    substate[i] = None
+                    buffers.append(v)
+                    buffer_paths.append(path + [i])
+        elif isinstance(substate, dict):
+            for k, v in list(substate.items()):  # we need to copy to a list since substate will be modified
+                if isinstance(v, (dict, list, tuple)):
+                    seperate_buffers(v, path + [k], buffer_paths, buffers)
+                if isinstance(v, _binary_types):
+                    substate.pop(k)
+                    buffers.append(v)
+                    buffer_paths.append(path + [k])
+        else:
+            raise ValueError("expected state to be a list or dict, not %r" % substate)
+
+    buffer_paths, buffers = [], []
+    seperate_buffers(state, [], buffer_paths, buffers)
+    state_with_buffers = {}
+    # any part of the state that has buffers needs to be treated seperately
+    # since of a issue as indicated in .open(..)
+    # also remove top level elements if they contain nested buffers (len(k) > 1)
+    for key in set([k[0] for k in buffer_paths if len(k) > 1]):
+        state_with_buffers[key] = state[key]
+        del state[key]
+    return state, state_with_buffers, buffer_paths, buffers
+
+
 class CallbackDispatcher(LoggingConfigurable):
     """A structure for registering and running callbacks"""
     callbacks = List()
@@ -213,7 +262,7 @@ def __del__(self):
     def open(self):
         """Open a comm to the frontend if one isn't already open."""
         if self.comm is None:
-            state, buffer_keys, buffers = self._split_state_buffers(self.get_state())
+            state, state_with_buffers, buffer_paths, buffers = _split_state_buffers(self.get_state())
 
             args = dict(target_name='jupyter.widget', data=state)
             if self._model_id is not None:
@@ -223,6 +272,10 @@ def open(self):
             if buffers:
                 # FIXME: workaround ipykernel missing binary message support in open-on-init
                 # send state with binary elements as second message
+                # TODO: if this gets fixed, _split_state_buffers does not need to have a seperate
+                # state_with_buffers, this is needed since first the object is created without sending
+                # the buffers, then on the js side, it tries to serialize, while the buffer have not been
+                # patched in yet, see also widget.ts:_handle_comm_msg
                 self.send_state()
 
     @observe('comm')
@@ -258,16 +311,6 @@ def close(self):
             self.comm = None
             self._ipython_display_ = None
 
-    def _split_state_buffers(self, state):
-        """Return (state_without_buffers, buffer_keys, buffers) for binary message parts"""
-        buffer_keys, buffers = [], []
-        for k, v in list(state.items()):
-            if isinstance(v, _binary_types):
-                state.pop(k)
-                buffers.append(v)
-                buffer_keys.append(k)
-        return state, buffer_keys, buffers
-
     def send_state(self, key=None):
         """Sends the widget state, or a piece of it, to the front-end.
 
@@ -277,8 +320,8 @@ def send_state(self, key=None):
             A single property's name or iterable of property names to sync with the front-end.
         """
         state = self.get_state(key=key)
-        state, buffer_keys, buffers = self._split_state_buffers(state)
-        msg = {'method': 'update', 'state': state, 'buffers': buffer_keys}
+        state, state_with_buffers, buffer_paths, buffers = _split_state_buffers(state)
+        msg = {'method': 'update', 'state': state, 'buffers': buffer_paths, 'state_with_buffers': state_with_buffers}
         self._send(msg, buffers=buffers)
 
     def get_state(self, key=None, drop_defaults=False):
@@ -453,8 +496,14 @@ def _handle_msg(self, msg):
             if 'sync_data' in data:
                 # get binary buffers too
                 sync_data = data['sync_data']
-                for i,k in enumerate(data.get('buffer_keys', [])):
-                    sync_data[k] = msg['buffers'][i]
+                if 'buffer_paths' in data:
+                    for path, buffer in zip(data['buffer_paths'], msg['buffers']):
+                        # we'd like to set say sync_data['x'][0]['y'] = buffer
+                        # where path in this example would be ['x', 0, 'y']
+                        obj = sync_data
+                        for key in path[:-1]:
+                            obj = obj[key]
+                        obj[path[-1]] = buffer
                 self.set_state(sync_data) # handles all methods
 
         # Handle a state request.

diff --git a/jupyter-js-widgets/src/widget.ts b/jupyter-js-widgets/src/widget.ts
@@ -172,11 +172,18 @@ class WidgetModel extends Backbone.Model {
             case 'update':
                 this.state_change = this.state_change
                     .then(() => {
-                        var state = msg.content.data.state || {};
-                        var buffer_keys = msg.content.data.buffers || [];
+                        // see Widget.open/_split_state_buffers about why we need state_with_buffers
+                        var state = _.extend({}, msg.content.data.state || {}, msg.content.data.state_with_buffers);
+                        var buffer_paths = msg.content.data.buffers || [];
                         var buffers = msg.buffers || [];
-                        for (var i=0; i<buffer_keys.length; i++) {
-                            state[buffer_keys[i]] = buffers[i];
+                        for (var i=0; i<buffer_paths.length; i++) {
+                             // say we want to set state[x][y[z] = buffers[i]
+                            var obj = state;
+                            // we first get obj = state[x][y]
+                            for (var j = 0; j < buffer_paths[i].length-1; j++)
+                                obj = obj[buffer_paths[i][j]];
+                            // and then set: obj[z] = buffers[i]
+                            obj[buffer_paths[i][buffer_paths[i].length-1]] = buffers[i];
                         }
                         return (this.constructor as typeof WidgetModel)._deserialize_state(state, this.widget_manager);
                     }).then((state) => {
@@ -399,23 +406,82 @@ class WidgetModel extends Backbone.Model {
             // get binary values, then send
             var keys = Object.keys(state);
             var buffers = [];
-            var buffer_keys = [];
-            for (var i=0; i<keys.length; i++) {
-                var key = keys[i];
-                var value = state[key];
-                if (value) {
-                    if (value.buffer instanceof ArrayBuffer
-                        || value instanceof ArrayBuffer) {
-                        buffers.push(value);
-                        buffer_keys.push(key);
-                        delete state[key];
+            var buffer_paths = [];
+            // keep track of what we visited, to avoid endless loops, when an object ancester
+            // refers to itself, we cannot use an object, since using objects for keys don't work
+            var visited_set = [];
+            // this function goes through lists and object and removes arraybuffers
+            // they will be transferred seperately, since they don't json'ify
+            // on the python side the inverse happens
+            // if we need to remove an object from a list, we need to clone that list, otherwise we may modify
+            // the internal state of the widget model
+            // however, we do not want to clone everything, for performance
+            function seperate_buffers(obj, path) {
+                if(visited_set.indexOf(obj) != -1) { // we already visited this object
+                    return obj;
+                }
+                visited_set.push(obj);
+                if (_.isArray(obj)) {
+                    var is_cloned = false;
+                    for (var i = 0; i < obj.length; i++) {
+                        var value = obj[i];
+                        if(value) {
+                            if (value.buffer instanceof ArrayBuffer || value instanceof ArrayBuffer) {
+                                if(!is_cloned) {
+                                    obj = _.map(obj, _.identity);
+                                    is_cloned = true;
+                                }
+                                buffers.push(value);
+                                buffer_paths.push(path.concat([i]));
+                                // easier to just keep the array, but clear the entry, otherwise we have to think
+                                // about array length
+                                obj[i] = null;
+                            }
+                            else {
+                                var new_value  = seperate_buffers(value, path.concat([i]));
+                                if((new_value != value) && !is_cloned) { // only clone when we have to
+                                    obj = _.map(obj, _.identity);
+                                    is_cloned = true;
+                                    obj[i] = new_value;
+                                }
+                            }
+                        }
                     }
                 }
+                else if(_.isObject(obj)) {
+                    for (var key in obj) {
+                        var is_cloned = false;
+                        if (!obj.hasOwnProperty || obj.hasOwnProperty(key)) {
+                            var value = obj[key];
+                            if(value) {
+                                if (value.buffer instanceof ArrayBuffer || value instanceof ArrayBuffer) {
+                                    if(!is_cloned) {
+                                        obj = _.mapObject(obj, _.identity); // clone only once for performance
+                                        is_cloned = true;
+                                    }
+                                    buffers.push(value);
+                                    buffer_paths.push(path.concat([key]));
+                                    delete obj[key]; // for objects/dicts we just delete them
+                                }
+                                else {
+                                    var new_value  = seperate_buffers(value, path.concat([key]));
+                                    if((new_value != value) && !is_cloned) { // only clone when we have to
+                                        obj = _.mapObject(obj, _.identity);
+                                        is_cloned = true;
+                                        obj[key] = new_value;
+                                    }
+                                }
+                            }
+                        }
+                    }
+                }
+                return obj;
             }
+            state = seperate_buffers(state, []); // could return a clone
             this.comm.send({
                 method: 'backbone',
                 sync_data: state,
-                buffer_keys: buffer_keys
+                buffer_paths: buffer_paths
             }, callbacks, {}, buffers);
         }).catch((error) => {
             this.pending_msgs--;