Monday morning tap at "Challenges"
[Ultimately_Untrue_Thought.git] / content / drafts / challenges-to-yudkowskys-pronoun-reform-proposal.md
index 490c424..2f2c056 100644 (file)
@@ -83,6 +83,22 @@ Kerr suggests that preferred pronouns have a similar effect, that "a conflict be
 
 Unfortunately, I don't have a study with objective measurements on hand (let me know in the comments if you do!), but I think most native English speakers who try this exercise and introspect—especially using examples where the trans person exhibits features or behavior typical of their natal sex—will agree with Kerr's assessment: "You can know perfectly the actual sex of a male person, and yet you will still react differently if someone calls them _she_ instead of _he_."
 
+Let's relate this is Yudkowsky's specialty of artificial intelligence. In a post on ["Multimodal Neurons in Artificial Neural Networks"](https://openai.com/blog/multimodal-neurons/), Gabriel Goh _et al._ explore the capabilities and biases of the [CLIP](https://openai.com/blog/clip/) neural network trained on textual and image data.
+
+There are some striking parallels between CLIP's behavior, and phenomena observed in neuroscience. Neurons in the human brain have been observed to respond to the same concept represented in different modalities (_e.g._, [Quiroga _et al._](/papers/quiroga_et_al-invariant_visual_representation_by_single_neurons.pdf) observed a neuron in one patient that responded to photos and sketches of actress Halle Berry, as well as the text string "Halle Berry"), and so do CLIP neurons. Futhermore, CLIP is vulnerable to a Stroop-like effect where its image-classification capabilities can be fooled by "typographic attacks"—a dog with instances of the text "$$$" superimposed over it gets classified as a piggy bank, an apple with a handwritten sign saying "LIBRARY" gets classified as a library. The network knows perfectly what dogs and apples look like under ordinary circumstances, and yet still reacts differently when presented with clashing textual labels.
+
+I conjecture that the appeal of subject-chosen pronouns lies _precisely_ in how they exert Stroop-like effects on speakers' cognition. (Once again, if it were _actually true_ that _she_ and _he_ had no difference in meaning, _there would be no reason to care_.) [Pronoun badges](/2018/Oct/sticker-prices/) are, quite literally, a typographic attack against native English speakers' brains.
+
+Note, I mean this as a value-free description of how the convention _actually functions_ in the real world, [not a condemnation](https://www.lesswrong.com/posts/N9oKuQKuf7yvCCtfq/can-crimes-be-discussed-literally). One could consistently hold that these "attacks" are morally good—
+
+
+Is susceptibility to Stroop-like effects an indication of bad mind design? I mean, maybe! You could argue that! One would expect that an _intelligently_-designed agent (as contrasted to messy human brains coughed up [blind evolution](https://www.lesswrong.com/posts/jAToJHtg39AMTAuJo/evolutions-are-stupid-but-work-anyway) or [lucky](https://www.lesswrong.com/posts/dpzLqQQSs7XRacEfK/understanding-the-lottery-ticket-hypothesis) neural networks found by gradient descent) could easily bind and re-bind symbols on the fly: 
+
+
+
+
+
+
 [TODO: let's related this to Yudkowsky's specialty multimodal neurons— both CLIP and biological neurons respond to text/images; typographic attacks are the same thing as pronoun badges; you would expect the people aligning language models to be able to think these thoughts]
 
 Importantly, Kerr is _explicitly_ appealing to psychological effects of different pronoun conventions. She is absolutely _not_ claiming that the use of preferred pronouns is itself a "lie" about some testable proposition. She writes:
@@ -93,9 +109,9 @@ Importantly, Kerr is _explicitly_ appealing to psychological effects of differen
 
 > But I refuse to use female pronouns for anyone male.
 
-Note the wording: "That's a personal choice", "_I_ refuse". She knows perfectly well that people who use gender-identity-based pronouns aren't making a false claim that trans men produce sperm, _&c._! Rather, she's saying that a pronoun convention that groups together females, and a minority of males who wish they were female, affects our cognition about that minority of males in a way that's disadvantageous to Kerr's interests (because she wants to be especially alert to threats posed by males), such that Kerr refuses to comply with that convention in her own speech.
+Note the wording: "That's a personal choice", "_I_ refuse". She knows perfectly well that people who use gender-identity-based pronouns aren't making a false claim that trans men produce sperm, _&c._! Rather, she's saying that a pronoun convention that groups together females, and a minority of males who wish they were female, affects our cognition about that minority of males in a way that's disadvantageous to Kerr's interests (because she wants to be especially alert to threats posed by males), such that Kerr refuses to comply with that convention in her own speech. (Compare to how a Spanish speaker might refuse to address someone they disrespected as _usted_ because of its connotations, without thereby claiming that using _usted_ would make the sentence literally false.)
 
-I take pains to emphasize this because Yudkowsky repeatedly evinces ignorance about what his political opponents are claiming, repeatedly trying to frame the matter of dispute as to whether pronouns can be "lies" (to which Yudkowsky says, No, that would be ontologically confused)—whereas if you _actually read_ what the people on the other side of the policy debate are saying, they're largely _not claiming_ that "pronouns are lies"! (It seems fair to regard Kerr's article as representative of gender-critical ("TERF") concerns; I've seen the post linked in gender-critical circles more than once, and it's cited in [embattled former University of Sussex professor Kathleen Stock](https://en.wikipedia.org/wiki/Kathleen_Stock#Views_on_gender_self-identification)'s book _Material Girls_.)
+I take pains to emphasize this because Yudkowsky [misrepresents what his political opponents are typically claiming](https://slatestarcodex.com/2014/05/12/weak-men-are-superweapons/), repeatedly trying to frame the matter of dispute as to whether pronouns can be "lies" (to which Yudkowsky says, No, that would be ontologically confused)—whereas if you _actually read_ what the people on the other side of the policy debate are saying, they're largely _not claiming_ that "pronouns are lies"! (It seems fair to regard Kerr's article as representative of gender-critical ("TERF") concerns; I've seen the post linked in those circles more than once, and it's cited in [embattled former University of Sussex professor Kathleen Stock](https://en.wikipedia.org/wiki/Kathleen_Stock#Views_on_gender_self-identification)'s book _Material Girls_.)
 
 Anyway, given these reasons why the _existing_ meanings of _she_ and _he_ are relevant to the question of pronoun reform, what is Yudkowsky's response?
 
@@ -105,15 +121,20 @@ Apparently, to play dumb. In the comments of the Facebook post, Yudkowsky claims
 
 ...
 
-I'm sorry, but I can't take this self-report literally. I certainly [don't think Yudkowsky was _consciously_ lying](https://www.lesswrong.com/posts/bSmgPNS6MTJsunTzS/maybe-lying-doesn-t-exist) when he wrote that. Nevertheless, I am _incredibly_ skeptical that Yudkowsky _actually_ doesn't know what it feels like from the inside to feel like a pronoun is attached to sex more firmly than a proper name is attached to someone's appearance.
+I'm sorry, but I can't take this self-report literally. I certainly [don't think Yudkowsky was _consciously_ lying](https://www.lesswrong.com/posts/bSmgPNS6MTJsunTzS/maybe-lying-doesn-t-exist) when he wrote that. (When speaking or writing quickly without taking the time to scrupulously check, [it's common for little untruths and distortions to slip into one's speech](https://www.lesswrong.com/posts/pZSpbxPrftSndTdSf/honesty-beyond-internal-truth).) Nevertheless, I am _incredibly_ skeptical that Yudkowsky _actually_ doesn't know what it feels like from the inside to feel like a pronoun is attached to sex more firmly than a proper name is attached to someone's appearance.
+
+I realize this must seem impossibly rude and presumptuous of me. Yudkowsky _said_ he doesn't know what it feels like from the inside! That's a report out his own mental state, which he has privileged introspective access to, and I don't! What grounds could I possibly, _possibly_ have to think he's not telling the truth about his own mind? 
 
-[TODO: how could you possibly know that?]
+It's a good question. And my answer is, even without mind-reading technology, people's minds are still part of the same cause-and-effect physical universe that I can (must) make probabilistic inferences about, and verbal self-reports aren't my _only_ source of evidence about someone's mind. In particular, if someone's verbal self-report mis-predicts what we know about their _behavior_, it's far from clear that we should trust the report more than our senses.
 
 The thing is, Eliezer Yudkowsky is a native English speaker born in 1979. As a native English speaker born in 1987, I have a _pretty good_ mental model of how native English speakers born in the late 20th century use language.
 
 And one of the things native English speakers born in the late 20th century are _very good_ at doing, is noticing what sex people are and using the corresponding pronouns without consciously thinking about it, because the pronouns are attached to the concept of sex in their heads more firmly than proper names are attached to something in their heads.
 
-I would bet at very generous odds at some point in his four decades on Earth, Eliezer Yudkowsky has used _she_ or _he_ on the basis of perceived sex to refer to someone whose name he didn't know. Because _all native English speakers do this_.
+I would bet at very generous odds at some point in his four decades on Earth, Eliezer Yudkowsky has used _she_ or _he_ on the basis of perceived sex to refer to someone whose name he didn't know. Because _all native English speakers do this_. Moreover, we can say something about the cognitive algorithm underlying _how_ they do this: [people can recognize sex from facial structure _alone_ (hair covered, males clean-shaven) at 96% accuracy](/papers/bruce_et_al-sex_discrimination_how_do_we_tell.pdf)
+
+
+I would also bet at very generous odds that in his four decades on Earth, Eliezer Yudkowsky has very rarely if ever assumed what someone's name is on the basis of their appearance without being told.
 
 
 
@@ -129,7 +150,7 @@ Okay, so Yudkowsky
 
 [TODO: self-identity is a Schelling point]
 
-
+appeal to inner privacy conversation-halter https://www.lesswrong.com/posts/wqmmv6NraYv4Xoeyj/conversation-halters
 
 
 [OUTLINE of remainder—