Monday morning tap at "Challenges"
authorM. Taylor Saotome-Westlake <ultimatelyuntruethought@gmail.com>
Mon, 6 Dec 2021 19:01:01 +0000 (11:01 -0800)
committerM. Taylor Saotome-Westlake <ultimatelyuntruethought@gmail.com>
Mon, 6 Dec 2021 19:01:01 +0000 (11:01 -0800)
Last week's "write every morning" campaign didn't end up sticking past
Tuesday, but maybe it'll stick this week?!

content/drafts/challenges-to-yudkowskys-pronoun-reform-proposal.md

index ba2713e..2f2c056 100644 (file)
@@ -83,6 +83,22 @@ Kerr suggests that preferred pronouns have a similar effect, that "a conflict be
 
 Unfortunately, I don't have a study with objective measurements on hand (let me know in the comments if you do!), but I think most native English speakers who try this exercise and introspect—especially using examples where the trans person exhibits features or behavior typical of their natal sex—will agree with Kerr's assessment: "You can know perfectly the actual sex of a male person, and yet you will still react differently if someone calls them _she_ instead of _he_."
 
+Let's relate this is Yudkowsky's specialty of artificial intelligence. In a post on ["Multimodal Neurons in Artificial Neural Networks"](https://openai.com/blog/multimodal-neurons/), Gabriel Goh _et al._ explore the capabilities and biases of the [CLIP](https://openai.com/blog/clip/) neural network trained on textual and image data.
+
+There are some striking parallels between CLIP's behavior, and phenomena observed in neuroscience. Neurons in the human brain have been observed to respond to the same concept represented in different modalities (_e.g._, [Quiroga _et al._](/papers/quiroga_et_al-invariant_visual_representation_by_single_neurons.pdf) observed a neuron in one patient that responded to photos and sketches of actress Halle Berry, as well as the text string "Halle Berry"), and so do CLIP neurons. Futhermore, CLIP is vulnerable to a Stroop-like effect where its image-classification capabilities can be fooled by "typographic attacks"—a dog with instances of the text "$$$" superimposed over it gets classified as a piggy bank, an apple with a handwritten sign saying "LIBRARY" gets classified as a library. The network knows perfectly what dogs and apples look like under ordinary circumstances, and yet still reacts differently when presented with clashing textual labels.
+
+I conjecture that the appeal of subject-chosen pronouns lies _precisely_ in how they exert Stroop-like effects on speakers' cognition. (Once again, if it were _actually true_ that _she_ and _he_ had no difference in meaning, _there would be no reason to care_.) [Pronoun badges](/2018/Oct/sticker-prices/) are, quite literally, a typographic attack against native English speakers' brains.
+
+Note, I mean this as a value-free description of how the convention _actually functions_ in the real world, [not a condemnation](https://www.lesswrong.com/posts/N9oKuQKuf7yvCCtfq/can-crimes-be-discussed-literally). One could consistently hold that these "attacks" are morally good—
+
+
+Is susceptibility to Stroop-like effects an indication of bad mind design? I mean, maybe! You could argue that! One would expect that an _intelligently_-designed agent (as contrasted to messy human brains coughed up [blind evolution](https://www.lesswrong.com/posts/jAToJHtg39AMTAuJo/evolutions-are-stupid-but-work-anyway) or [lucky](https://www.lesswrong.com/posts/dpzLqQQSs7XRacEfK/understanding-the-lottery-ticket-hypothesis) neural networks found by gradient descent) could easily bind and re-bind symbols on the fly: 
+
+
+
+
+
+
 [TODO: let's related this to Yudkowsky's specialty multimodal neurons— both CLIP and biological neurons respond to text/images; typographic attacks are the same thing as pronoun badges; you would expect the people aligning language models to be able to think these thoughts]
 
 Importantly, Kerr is _explicitly_ appealing to psychological effects of different pronoun conventions. She is absolutely _not_ claiming that the use of preferred pronouns is itself a "lie" about some testable proposition. She writes:
@@ -95,7 +111,7 @@ Importantly, Kerr is _explicitly_ appealing to psychological effects of differen
 
 Note the wording: "That's a personal choice", "_I_ refuse". She knows perfectly well that people who use gender-identity-based pronouns aren't making a false claim that trans men produce sperm, _&c._! Rather, she's saying that a pronoun convention that groups together females, and a minority of males who wish they were female, affects our cognition about that minority of males in a way that's disadvantageous to Kerr's interests (because she wants to be especially alert to threats posed by males), such that Kerr refuses to comply with that convention in her own speech. (Compare to how a Spanish speaker might refuse to address someone they disrespected as _usted_ because of its connotations, without thereby claiming that using _usted_ would make the sentence literally false.)
 
-I take pains to emphasize this because Yudkowsky [misrepresents what his political opponents are claiming](https://slatestarcodex.com/2014/05/12/weak-men-are-superweapons/), repeatedly trying to frame the matter of dispute as to whether pronouns can be "lies" (to which Yudkowsky says, No, that would be ontologically confused)—whereas if you _actually read_ what the people on the other side of the policy debate are saying, they're largely _not claiming_ that "pronouns are lies"! (It seems fair to regard Kerr's article as representative of gender-critical ("TERF") concerns; I've seen the post linked in those circles more than once, and it's cited in [embattled former University of Sussex professor Kathleen Stock](https://en.wikipedia.org/wiki/Kathleen_Stock#Views_on_gender_self-identification)'s book _Material Girls_.)
+I take pains to emphasize this because Yudkowsky [misrepresents what his political opponents are typically claiming](https://slatestarcodex.com/2014/05/12/weak-men-are-superweapons/), repeatedly trying to frame the matter of dispute as to whether pronouns can be "lies" (to which Yudkowsky says, No, that would be ontologically confused)—whereas if you _actually read_ what the people on the other side of the policy debate are saying, they're largely _not claiming_ that "pronouns are lies"! (It seems fair to regard Kerr's article as representative of gender-critical ("TERF") concerns; I've seen the post linked in those circles more than once, and it's cited in [embattled former University of Sussex professor Kathleen Stock](https://en.wikipedia.org/wiki/Kathleen_Stock#Views_on_gender_self-identification)'s book _Material Girls_.)
 
 Anyway, given these reasons why the _existing_ meanings of _she_ and _he_ are relevant to the question of pronoun reform, what is Yudkowsky's response?